LCOV - code coverage report
Current view: top level - libreoffice/basic/source/comp - scanner.cxx (source / functions) Hit Total Coverage
Test: Lines: 262 288 91.0 %
Date: 2012-12-27 Functions: 11 11 100.0 %
Legend: Lines: hit not hit

          Line data    Source code
       1             : /* -*- Mode: C++; tab-width: 4; indent-tabs-mode: nil; c-basic-offset: 4 -*- */
       2             : /*
       3             :  * This file is part of the LibreOffice project.
       4             :  *
       5             :  * This Source Code Form is subject to the terms of the Mozilla Public
       6             :  * License, v. 2.0. If a copy of the MPL was not distributed with this
       7             :  * file, You can obtain one at
       8             :  *
       9             :  * This file incorporates work covered by the following license notice:
      10             :  *
      11             :  *   Licensed to the Apache Software Foundation (ASF) under one or more
      12             :  *   contributor license agreements. See the NOTICE file distributed
      13             :  *   with this work for additional information regarding copyright
      14             :  *   ownership. The ASF licenses this file to you under the Apache
      15             :  *   License, Version 2.0 (the "License"); you may not use this file
      16             :  *   except in compliance with the License. You may obtain a copy of
      17             :  *   the License at .
      18             :  */
      19             : 
      20             : #include "basiccharclass.hxx"
      21             : #include "sbcomp.hxx"
      22             : 
      23             : #include <vcl/svapp.hxx>
      24             : 
      25         111 : SbiScanner::SbiScanner( const ::rtl::OUString& rBuf, StarBASIC* p ) : aBuf( rBuf )
      26             : {
      27         111 :     pBasic   = p;
      28         111 :     pLine    = NULL;
      29         111 :     nVal     = 0;
      30         111 :     eScanType = SbxVARIANT;
      31         111 :     nErrors  = 0;
      32         111 :     nBufPos  = 0;
      33         111 :     nCurCol1 = 0;
      34         111 :     nSavedCol1 = 0;
      35         111 :     nColLock = 0;
      36         111 :     nLine    = 0;
      37         111 :     nCol1    = 0;
      38         111 :     nCol2    = 0;
      39         111 :     nCol     = 0;
      40             :     bError   =
      41             :     bAbort   =
      42             :     bSpaces  =
      43             :     bNumber  =
      44             :     bSymbol  =
      45             :     bCompatible =
      46             :     bVBASupportOn =
      47             :     bInStatement =
      48         111 :     bPrevLineExtentsComment = false;
      49         111 :     bHash    = true;
      50         111 : }
      51             : 
      52         138 : SbiScanner::~SbiScanner()
      53         138 : {}
      54             : 
      55          47 : void SbiScanner::LockColumn()
      56             : {
      57          47 :     if( !nColLock++ )
      58          45 :         nSavedCol1 = nCol1;
      59          47 : }
      60             : 
      61          47 : void SbiScanner::UnlockColumn()
      62             : {
      63          47 :     if( nColLock )
      64          34 :         nColLock--;
      65          47 : }
      66             : 
      67           6 : void SbiScanner::GenError( SbError code )
      68             : {
      69           6 :     if( GetSbData()->bBlockCompilerError )
      70             :     {
      71           0 :         bAbort = true;
      72           6 :         return;
      73             :     }
      74           6 :     if( !bError )
      75             :     {
      76           6 :         bool bRes = true;
      77             :         // report only one error per statement
      78           6 :         bError = true;
      79           6 :         if( pBasic )
      80             :         {
      81             :             // in case of EXPECTED or UNEXPECTED it always refers
      82             :             // to the last token, so take the Col1 over
      83           0 :             sal_Int32 nc = nColLock ? nSavedCol1 : nCol1;
      84           0 :             switch( code )
      85             :             {
      86             :                 case SbERR_EXPECTED:
      87             :                 case SbERR_UNEXPECTED:
      88             :                 case SbERR_SYMBOL_EXPECTED:
      89             :                 case SbERR_LABEL_EXPECTED:
      90           0 :                     nc = nCol1;
      91           0 :                     if( nc > nCol2 ) nCol2 = nc;
      92           0 :                     break;
      93             :             }
      94           0 :             bRes = pBasic->CError( code, aError, nLine, nc, nCol2 );
      95             :         }
      96           6 :         bAbort = bAbort || !bRes  || ( code == SbERR_NO_MEMORY || code == SbERR_PROG_TOO_LARGE );
      97             :     }
      98           6 :     nErrors++;
      99             : }
     100             : 
     101             : 
     102             : // used by SbiTokenizer::MayBeLabel() to detect a label
     103          27 : bool SbiScanner::DoesColonFollow()
     104             : {
     105          27 :     if(nCol < aLine.getLength() && aLine[nCol] == ':')
     106             :     {
     107           0 :         ++pLine; ++nCol;
     108           0 :         return true;
     109             :     }
     110             :     else
     111          27 :         return false;
     112             : }
     113             : 
     114             : // test for legal suffix
     115        1000 : static SbxDataType GetSuffixType( sal_Unicode c )
     116             : {
     117        1000 :     switch (c)
     118             :     {
     119             :     case '%':
     120           1 :         return SbxDataType(SbxINTEGER);
     121             :     case '&':
     122           2 :         return SbxDataType(SbxLONG);
     123             :     case '!':
     124           1 :         return SbxDataType(SbxSINGLE);
     125             :     case '#':
     126           1 :         return SbxDataType(SbxDOUBLE);
     127             :     case '@':
     128           1 :         return SbxDataType(SbxCURRENCY);
     129             :     case '$':
     130           1 :         return SbxDataType(SbxSTRING);
     131             :     default:
     132         993 :         return SbxDataType(SbxVARIANT);
     133             :     }
     134             : }
     135             : 
     136             : // reading the next symbol into the variables aSym, nVal and eType
     137             : // return value is sal_False at EOF or errors
     138             : #define BUF_SIZE 80
     139             : 
     140        1095 : void SbiScanner::scanAlphanumeric()
     141             : {
     142        1095 :     sal_Int32 n = nCol;
     143        8472 :     while(nCol < aLine.getLength() && (theBasicCharClass::get().isAlphaNumeric(aLine[nCol], bCompatible) || aLine[nCol] == '_'))
     144             :     {
     145        6282 :         ++pLine;
     146        6282 :         ++nCol;
     147             :     }
     148        1095 :     aSym = aLine.copy(n, nCol - n);
     149        1095 : }
     150             : 
     151           1 : void SbiScanner::scanGoto()
     152             : {
     153           1 :     sal_Int32 n = nCol;
     154           4 :     while(n < aLine.getLength() && theBasicCharClass::get().isWhitespace(aLine[n]))
     155           2 :         ++n;
     156             : 
     157           1 :     if(n + 1 < aLine.getLength())
     158             :     {
     159           1 :         ::rtl::OUString aTemp = aLine.copy(n, 2);
     160           1 :         if(aTemp.equalsIgnoreAsciiCaseAsciiL(RTL_CONSTASCII_STRINGPARAM("to")))
     161             :         {
     162           1 :             aSym = ::rtl::OUString(RTL_CONSTASCII_USTRINGPARAM("goto"));
     163           1 :             pLine += n + 2 - nCol;
     164           1 :             nCol = n + 2;
     165           1 :         }
     166             :     }
     167           1 : }
     168             : 
     169         756 : bool SbiScanner::readLine()
     170             : {
     171         756 :     if(nBufPos >= aBuf.getLength())
     172         111 :         return false;
     173             : 
     174         645 :     sal_Int32 n = nBufPos;
     175         645 :     sal_Int32 nLen = aBuf.getLength();
     176             : 
     177       16707 :     while(n < nLen && aBuf[n] != '\r' && aBuf[n] != '\n')
     178       15417 :         ++n;
     179             : 
     180             :     // Trim trailing whitespace
     181         645 :     sal_Int32 nEnd = n;
     182        1664 :     while(nBufPos < nEnd && theBasicCharClass::get().isWhitespace(aBuf[nEnd - 1]))
     183         374 :         --nEnd;
     184             : 
     185         645 :     aLine = aBuf.copy(nBufPos, nEnd - nBufPos);
     186             : 
     187             :     // Fast-forward past the line ending
     188         645 :     if(n + 1 < nLen && aBuf[n] == '\r' && aBuf[n + 1] == '\n')
     189           5 :         n += 2;
     190         640 :     else if(n < nLen)
     191         569 :         ++n;
     192             : 
     193         645 :     nBufPos = n;
     194         645 :     pLine = aLine.getStr();
     195             : 
     196         645 :     ++nLine;
     197         645 :     nCol = nCol1 = nCol2 = 0;
     198         645 :     nColLock = 0;
     199             : 
     200         645 :     return true;
     201             : }
     202             : 
     203        2773 : bool SbiScanner::NextSym()
     204             : {
     205             :     // memorize for the EOLN-case
     206        2773 :     sal_Int32 nOldLine = nLine;
     207        2773 :     sal_Int32 nOldCol1 = nCol1;
     208        2773 :     sal_Int32 nOldCol2 = nCol2;
     209        2773 :     sal_Unicode buf[ BUF_SIZE ], *p = buf;
     210             : 
     211        2773 :     eScanType = SbxVARIANT;
     212        2773 :     aSym = ::rtl::OUString();
     213        2773 :     bHash = bSymbol = bNumber = bSpaces = false;
     214             : 
     215             :     // read in line?
     216        2773 :     if( !pLine )
     217             :     {
     218         756 :         if(!readLine())
     219         111 :             return false;
     220             : 
     221         645 :         nOldLine = nLine;
     222         645 :         nOldCol1 = nOldCol2 = 0;
     223             :     }
     224             : 
     225        2662 :     if(nCol < aLine.getLength() && theBasicCharClass::get().isWhitespace(aLine[nCol]))
     226             :     {
     227        1218 :         bSpaces = true;
     228        5199 :         while(nCol < aLine.getLength() && theBasicCharClass::get().isWhitespace(aLine[nCol]))
     229        2763 :             ++pLine, ++nCol;
     230             :     }
     231             : 
     232        2662 :     nCol1 = nCol;
     233             : 
     234             :     // only blank line?
     235        2662 :     if(nCol >= aLine.getLength())
     236         563 :         goto eoln;
     237             : 
     238        2099 :     if( bPrevLineExtentsComment )
     239           0 :         goto PrevLineCommentLbl;
     240             : 
     241        2099 :     if(nCol < aLine.getLength() && aLine[nCol] == '#')
     242             :     {
     243           0 :         ++pLine;
     244           0 :         ++nCol;
     245           0 :         bHash = true;
     246             :     }
     247             : 
     248             :     // copy character if symbol
     249        2099 :     if(nCol < aLine.getLength() && (theBasicCharClass::get().isAlpha(aLine[nCol], bCompatible) || aLine[nCol] == '_'))
     250             :     {
     251             :         // if there's nothing behind '_' , it's the end of a line!
     252        1109 :         if(nCol + 1 == aLine.getLength() && aLine[nCol] == '_')
     253             :         {
     254             :             // Note that nCol is not incremented here...
     255          14 :             ++pLine;
     256          14 :             goto eoln;
     257             :         }
     258             : 
     259        1095 :         bSymbol = true;
     260             : 
     261        1095 :         scanAlphanumeric();
     262             : 
     263             :         // Special handling for "go to"
     264        1095 :         if(nCol < aLine.getLength() && bCompatible && aSym.equalsIgnoreAsciiCaseAsciiL(RTL_CONSTASCII_STRINGPARAM("go")))
     265           1 :             scanGoto();
     266             : 
     267             :         // replace closing '_' by space when end of line is following
     268             :         // (wrong line continuation otherwise)
     269        1095 :         if(nCol == aLine.getLength() && aLine[nCol - 1] == '_' )
     270             :         {
     271             :             // We are going to modify a potentially shared string, so force
     272             :             // a copy, so that aSym is not modified by the following operation
     273           1 :             ::rtl::OUString aSymCopy( aSym.getStr(), aSym.getLength() );
     274           1 :             aSym = aSymCopy;
     275             : 
     276             :             // HACK: modifying a potentially shared string here!
     277           1 :             *((sal_Unicode*)(pLine-1)) = ' ';
     278             :         }
     279             : 
     280             :         // type recognition?
     281             :         // don't test the exclamation mark
     282             :         // if there's a symbol behind it
     283        1097 :         else if((nCol >= aLine.getLength() || aLine[nCol] != '!') ||
     284           3 :                 (nCol + 1 >= aLine.getLength() || !theBasicCharClass::get().isAlpha(aLine[nCol + 1], bCompatible)))
     285             :         {
     286        1093 :             if(nCol < aLine.getLength())
     287             :             {
     288         852 :                 SbxDataType t(GetSuffixType(aLine[nCol]));
     289         852 :                 if( t != SbxVARIANT )
     290             :                 {
     291           7 :                     eScanType = t;
     292           7 :                     ++pLine;
     293           7 :                     ++nCol;
     294             :                 }
     295             :             }
     296             :         }
     297             :     }
     298             : 
     299             :     // read in and convert if number
     300        2760 :     else if((nCol < aLine.getLength() && theBasicCharClass::get().isDigit(aLine[nCol] & 0xFF)) ||
     301        1770 :             (nCol + 1 < aLine.getLength() && aLine[nCol] == '.' && theBasicCharClass::get().isDigit(aLine[nCol + 1] & 0xFF)))
     302             :     {
     303         148 :         short exp = 0;
     304         148 :         short comma = 0;
     305         148 :         short ndig = 0;
     306         148 :         short ncdig = 0;
     307         148 :         eScanType = SbxDOUBLE;
     308         148 :         bool bBufOverflow = false;
     309         660 :         while(nCol < aLine.getLength() && strchr("0123456789.DEde", aLine[nCol]))
     310             :         {
     311             :             // from 4.1.1996: buffer full? -> go on scanning empty
     312         364 :             if( (p-buf) == (BUF_SIZE-1) )
     313             :             {
     314          47 :                 bBufOverflow = true;
     315          47 :                 ++pLine, ++nCol;
     316          47 :                 continue;
     317             :             }
     318             :             // point or exponent?
     319         317 :             if(aLine[nCol] == '.')
     320             :             {
     321           9 :                 if( ++comma > 1 )
     322             :                 {
     323           1 :                     ++pLine; ++nCol; continue;
     324             :                 }
     325             :                 else
     326             :                 {
     327           8 :                     *p = '.';
     328           8 :                     ++p, ++pLine, ++nCol;
     329             :                 }
     330             :             }
     331         308 :             else if(strchr("DdEe", aLine[nCol]))
     332             :             {
     333           7 :                 if (++exp > 1)
     334             :                 {
     335           1 :                     ++pLine; ++nCol; continue;
     336             :                 }
     337             : 
     338           6 :                 *p = 'E';
     339           6 :                 ++p, ++pLine, ++nCol;
     340             : 
     341           6 :                 if(aLine[nCol] == '+')
     342           2 :                     ++pLine, ++nCol;
     343           4 :                 else if(aLine[nCol] == '-')
     344             :                 {
     345           2 :                     *p = '-';
     346           2 :                     ++p, ++pLine, ++nCol;
     347             :                 }
     348             :             }
     349             :             else
     350             :             {
     351         301 :                 *p = aLine[nCol];
     352         301 :                 ++p, ++pLine, ++nCol;
     353         301 :                 if( comma && !exp ) ++ncdig;
     354             :             }
     355         315 :             if (!exp) ++ndig;
     356             :         }
     357         148 :         *p = 0;
     358         148 :         aSym = p; bNumber = true;
     359             : 
     360         148 :         if( comma > 1 || exp > 1 )
     361           2 :         {   aError = ::rtl::OUString('.');
     362           2 :             GenError( SbERR_BAD_CHAR_IN_NUMBER );   }
     363             : 
     364             :         // #57844 use localized function
     365         148 :         nVal = rtl_math_uStringToDouble( buf, buf+(p-buf), '.', ',', NULL, NULL );
     366             : 
     367         148 :         ndig = ndig - comma;
     368         148 :         if( !comma && !exp )
     369             :         {
     370         134 :             if( nVal >= SbxMININT && nVal <= SbxMAXINT )
     371         134 :                 eScanType = SbxINTEGER;
     372             :             else
     373           0 :             if( nVal >= SbxMINLNG && nVal <= SbxMAXLNG )
     374           0 :                 eScanType = SbxLONG;
     375             :         }
     376         148 :         if( bBufOverflow )
     377           1 :             GenError( SbERR_MATH_OVERFLOW );
     378             : 
     379             :         // type recognition?
     380         148 :         SbxDataType t(GetSuffixType(aLine[nCol]));
     381         148 :         if( t != SbxVARIANT )
     382             :         {
     383           0 :             eScanType = t;
     384           0 :             ++pLine;
     385           0 :             ++nCol;
     386             :         }
     387             :     }
     388             : 
     389             :     // Hex/octal number? Read in and convert:
     390         842 :     else if(nCol < aLine.getLength() && aLine[nCol] == '&')
     391             :     {
     392          73 :         ++pLine; ++nCol;
     393          73 :         sal_Unicode cmp1[] = { '0','1','2','3','4','5','6','7','8','9','A','B','C','D','E','F', 0 };
     394          73 :         sal_Unicode cmp2[] = { '0', '1', '2', '3', '4', '5', '6', '7', 0 };
     395          73 :         sal_Unicode *cmp = cmp1;
     396          73 :         sal_Unicode base = 16;
     397          73 :         sal_Unicode ndig = 8;
     398          73 :         sal_Unicode xch  = aLine[nCol] & 0xFF;
     399          73 :         ++pLine; ++nCol;
     400          73 :         switch( toupper( xch ) )
     401             :         {
     402             :             case 'O':
     403           3 :                 cmp = cmp2; base = 8; ndig = 11; break;
     404             :             case 'H':
     405           6 :                 break;
     406             :             default :
     407             :                 // treated as an operator
     408          64 :                 --pLine; --nCol; nCol1 = nCol-1;
     409          64 :                 aSym = ::rtl::OUString(RTL_CONSTASCII_USTRINGPARAM("&"));
     410          64 :                 return true;
     411             :         }
     412           9 :         bNumber = true;
     413           9 :         long l = 0;
     414             :         int i;
     415           9 :         bool bBufOverflow = false;
     416          53 :         while(nCol < aLine.getLength() &&  theBasicCharClass::get().isAlphaNumeric(aLine[nCol] & 0xFF, bCompatible))
     417             :         {
     418             :             sal_Unicode ch = sal::static_int_cast< sal_Unicode >(
     419          35 :                 toupper(aLine[nCol] & 0xFF));
     420          35 :             ++pLine; ++nCol;
     421             :             // from 4.1.1996: buffer full, go on scanning empty
     422          35 :             if( (p-buf) == (BUF_SIZE-1) )
     423           0 :                 bBufOverflow = true;
     424          35 :             else if( rtl::OUString( cmp ).indexOf( ch ) != -1 )
     425          33 :                 *p++ = ch;
     426             :             else
     427             :             {
     428           2 :                 aError = ::rtl::OUString(ch);
     429           2 :                 GenError( SbERR_BAD_CHAR_IN_NUMBER );
     430             :             }
     431             :         }
     432           9 :         *p = 0;
     433          29 :         for( p = buf; *p; ++p )
     434             :         {
     435          21 :             i = (*p & 0xFF) - '0';
     436          21 :             if( i > 9 ) i -= 7;
     437          21 :             l = ( l * base ) + i;
     438          21 :             if( !ndig-- )
     439             :             {
     440           1 :                 GenError( SbERR_MATH_OVERFLOW ); break;
     441             :             }
     442             :         }
     443           9 :         if(nCol < aLine.getLength() && aLine[nCol] == '&') ++pLine, ++nCol;
     444           9 :         nVal = (double) l;
     445           9 :         eScanType = ( l >= SbxMININT && l <= SbxMAXINT ) ? SbxINTEGER : SbxLONG;
     446           9 :         if( bBufOverflow )
     447           0 :             GenError( SbERR_MATH_OVERFLOW );
     448             :     }
     449             : 
     450             :     // Strings:
     451         769 :     else if( *pLine == '"' || *pLine == '[' )
     452             :     {
     453          99 :         sal_Unicode cSep = *pLine;
     454          99 :         if( cSep == '[' )
     455           0 :             bSymbol = true, cSep = ']';
     456          99 :         sal_Int32 n = nCol + 1;
     457         230 :         while( *pLine )
     458             :         {
     459        2521 :             do pLine++, nCol++;
     460             :             while( *pLine && ( *pLine != cSep ) );
     461         131 :             if( *pLine == cSep )
     462             :             {
     463         131 :                 pLine++; nCol++;
     464         131 :                 if( *pLine != cSep || cSep == ']' ) break;
     465           0 :             } else aError = ::rtl::OUString(cSep), GenError( SbERR_EXPECTED );
     466             :         }
     467             :         // If VBA Interop then doen't eat the [] chars
     468          99 :         if ( cSep == ']' && bVBASupportOn )
     469           0 :             aSym = aLine.copy( n - 1, nCol - n  + 1);
     470             :         else
     471          99 :             aSym = aLine.copy( n, nCol - n - 1 );
     472             :         // get out duplicate string delimiters
     473          99 :         ::rtl::OUStringBuffer aSymBuf;
     474        2521 :         for ( sal_Int32 i = 0, len = aSym.getLength(); i < len; ++i )
     475             :         {
     476        2422 :             aSymBuf.append( aSym[i] );
     477        2422 :             if ( aSym[i] == cSep && ( i+1 < len ) && aSym[i+1] == cSep )
     478          32 :                 ++i;
     479             :         }
     480          99 :         aSym = aSymBuf.makeStringAndClear();
     481          99 :         if( cSep != ']' )
     482          99 :             eScanType = ( cSep == '#' ) ? SbxDATE : SbxSTRING;
     483             :     }
     484             :     // invalid characters:
     485         670 :     else if( ( *pLine & 0xFF ) >= 0x7F )
     486             :     {
     487           0 :         GenError( SbERR_SYNTAX ); pLine++; nCol++;
     488             :     }
     489             :     // other groups:
     490             :     else
     491             :     {
     492         670 :         sal_Int32 n = 1;
     493         670 :         switch( *pLine++ )
     494             :         {
     495           6 :             case '<': if( *pLine == '>' || *pLine == '=' ) n = 2; break;
     496           4 :             case '>': if( *pLine == '=' ) n = 2; break;
     497          18 :             case ':': if( *pLine == '=' ) n = 2; break;
     498             :         }
     499         670 :         aSym = aLine.copy( nCol, n );
     500         670 :         pLine += n-1; nCol = nCol + n;
     501             :     }
     502             : 
     503        2021 :     nCol2 = nCol-1;
     504             : 
     505             : PrevLineCommentLbl:
     506             : 
     507        5811 :     if( bPrevLineExtentsComment || (eScanType != SbxSTRING &&
     508        3790 :                                     ( aSym[0] == '\'' || aSym.equalsIgnoreAsciiCaseAsciiL( RTL_CONSTASCII_STRINGPARAM("REM") ) ) ) )
     509             :     {
     510          68 :         bPrevLineExtentsComment = false;
     511          68 :         aSym = ::rtl::OUString(RTL_CONSTASCII_USTRINGPARAM("REM"));
     512          68 :         sal_Int32 nLen = rtl_ustr_getLength(pLine);
     513          68 :         if( bCompatible && pLine[ nLen - 1 ] == '_' && pLine[ nLen - 2 ] == ' ' )
     514           0 :             bPrevLineExtentsComment = true;
     515          68 :         nCol2 = nCol2 + nLen;
     516          68 :         pLine = NULL;
     517             :     }
     518        2021 :     return true;
     519             : 
     520             : 
     521             : eoln:
     522         577 :     if( nCol && *--pLine == '_' )
     523             :     {
     524          14 :         pLine = NULL;
     525          14 :         bool bRes = NextSym();
     526          14 :         if( bVBASupportOn && aSym[0] == '.' )
     527             :         {
     528             :             // object _
     529             :             //    .Method
     530             :             // ^^^  <- spaces is legal in MSO VBA
     531             :             OSL_TRACE("*** resetting bSpaces***");
     532           0 :             bSpaces = false;
     533             :         }
     534          14 :         return bRes;
     535             :     }
     536             :     else
     537             :     {
     538         563 :         pLine = NULL;
     539         563 :         nLine = nOldLine;
     540         563 :         nCol1 = nOldCol1;
     541         563 :         nCol2 = nOldCol2;
     542         563 :         aSym = ::rtl::OUString(RTL_CONSTASCII_USTRINGPARAM("\n"));
     543         563 :         nColLock = 0;
     544         563 :         return true;
     545             :     }
     546             : }
     547             : 
     548             : /* vim:set shiftwidth=4 softtabstop=4 expandtab: */

Generated by: LCOV version 1.10