Mercurial > pub > ImplabNet
view Implab/Formats/JSON/JSONScanner.cs @ 176:0c3c69fe225b ref20160224
rewritten the text scanner
author | cin |
---|---|
date | Tue, 22 Mar 2016 18:58:40 +0300 |
parents | e227e78d72e4 |
children | a0ff6a0e9c44 |
line wrap: on
line source
using System; using System.Globalization; using Implab.Automaton; using System.Text; using Implab.Components; using System.IO; using Implab.Automaton.RegularExpressions; namespace Implab.Formats.JSON { /// <summary> /// Сканнер (лексер), разбивающий поток символов на токены JSON. /// </summary> public class JSONScanner : Disposable { readonly StringBuilder m_builder = new StringBuilder(); readonly ScannerContext<JSONGrammar.TokenType> m_jsonScanner = JSONGrammar.Instance.JsonDFA; readonly ScannerContext<JSONGrammar.TokenType> m_stringScanner = JSONGrammar.Instance.JsonStringDFA; readonly TextScanner m_scanner; /// <summary> /// Создает новый экземпляр сканнера /// </summary> public JSONScanner(string text) { Safe.ArgumentNotEmpty(text, "text"); m_scanner = new StringScanner(text); } public JSONScanner(TextReader reader, int bufferMax, int chunkSize) { Safe.ArgumentNotNull(reader, "reader"); m_scanner = new ReaderScanner(reader); } /// <summary> /// Читает следующий лексический элемент из входных данных. /// </summary> /// <param name="tokenValue">Возвращает значение прочитанного токена.</param> /// <param name="tokenType">Возвращает тип прочитанного токена.</param> /// <returns><c>true</c> - чтение произведено успешно. <c>false</c> - достигнут конец входных данных</returns> /// <remarks>В случе если токен не распознается, возникает исключение. Значения токенов обрабатываются, т.е. /// в строках обрабатываются экранированные символы, числа становтся типа double.</remarks> public bool ReadToken(out object tokenValue, out JsonTokenType tokenType) { JSONGrammar.TokenType[] tag; if (m_jsonScanner.Execute(m_scanner, out tag)) { switch (tag[0]) { case JSONGrammar.TokenType.StringBound: tokenValue = ReadString(); tokenType = JsonTokenType.String; break; case JSONGrammar.TokenType.Number: tokenValue = Double.Parse(m_scanner.GetTokenValue(), CultureInfo.InvariantCulture); tokenType = JsonTokenType.Number; break; default: tokenType = (JsonTokenType)tag[0]; tokenValue = m_scanner.GetTokenValue(); break; } return true; } tokenValue = null; tokenType = JsonTokenType.None; return false; } string ReadString() { int pos = 0; char[] buf = new char[6]; // the buffer for unescaping chars JSONGrammar.TokenType[] tag; m_builder.Clear(); while (m_stringScanner.Execute(m_scanner, out tag)) { switch (tag[0]) { case JSONGrammar.TokenType.StringBound: return m_builder.ToString(); case JSONGrammar.TokenType.UnescapedChar: m_scanner.CopyTokenTo(m_builder); break; case JSONGrammar.TokenType.EscapedUnicode: // \xXXXX - unicode escape sequence m_scanner.CopyTokenTo(buf, 0); m_builder.Append(StringTranslator.TranslateHexUnicode(buf, 2)); pos++; break; case JSONGrammar.TokenType.EscapedChar: // \t - escape sequence m_scanner.CopyTokenTo(buf, 0); m_builder.Append(StringTranslator.TranslateEscapedChar(buf[1])); break; default: break; } } throw new ParserException("Unexpected end of data"); } } }