# HG changeset patch
# User cin
# Date 1455894437 -10800
# Node ID 2a8466f0cb8aacae858116af47493d1126bfeecc
# Parent 5802131432e41edeb1de28fa005c6f5911a71555
DFA refactoring
diff -r 5802131432e4 -r 2a8466f0cb8a Implab/Implab.csproj
--- a/Implab/Implab.csproj Thu Feb 18 19:38:54 2016 +0300
+++ b/Implab/Implab.csproj Fri Feb 19 18:07:17 2016 +0300
@@ -7,9 +7,6 @@
Library
Implab
Implab
- 8.0.30703
- 2.0
- 0.2
v4.5
@@ -184,6 +181,8 @@
+
+
diff -r 5802131432e4 -r 2a8466f0cb8a Implab/Parsing/DFADefinition.cs
--- a/Implab/Parsing/DFADefinition.cs Thu Feb 18 19:38:54 2016 +0300
+++ b/Implab/Parsing/DFADefinition.cs Fri Feb 19 18:07:17 2016 +0300
@@ -5,28 +5,20 @@
using System.Linq;
namespace Implab.Parsing {
- public class DFADefinition : IDFADefinition {
- readonly List m_states;
+ public class DFADefinition : IDFADefinition {
+ readonly List> m_states;
public const int INITIAL_STATE = 1;
public const int UNREACHEBLE_STATE = 0;
- DFAStateDescriptior[] m_statesArray;
+ DFAStateDescriptior[] m_statesArray;
readonly int m_alpabetSize;
public DFADefinition(int alphabetSize) {
- m_states = new List();
+ m_states = new List>();
m_alpabetSize = alphabetSize;
- m_states.Add(new DFAStateDescriptior());
- }
-
- public DFAStateDescriptior[] States {
- get {
- if (m_statesArray == null)
- m_statesArray = m_states.ToArray();
- return m_statesArray;
- }
+ m_states.Add(new DFAStateDescriptior());
}
public bool InitialStateIsFinal {
@@ -37,7 +29,7 @@
public int AddState() {
var index = m_states.Count;
- m_states.Add(new DFAStateDescriptior {
+ m_states.Add(new DFAStateDescriptior {
final = false,
transitions = new int[AlphabetSize]
});
@@ -46,10 +38,10 @@
return index;
}
- public int AddState(int[] tag) {
+ public int AddState(TTag[] tag) {
var index = m_states.Count;
bool final = tag != null && tag.Length != 0;
- m_states.Add(new DFAStateDescriptior {
+ m_states.Add(new DFAStateDescriptior {
final = final,
transitions = new int[AlphabetSize],
tag = final ? tag : null
@@ -58,15 +50,41 @@
return index;
}
- public void DefineTransition(int s1,int s2, int symbol) {
- Safe.ArgumentInRange(s1, 0, m_states.Count-1, "s1");
- Safe.ArgumentInRange(s2, 0, m_states.Count-1, "s2");
- Safe.ArgumentInRange(symbol, 0, AlphabetSize-1, "symbol");
+ public void DefineTransition(TState s1, TState s2, TInput symbol) {
+ int is1 = StateAlphabet.Translate(s1);
+ int is2 = StateAlphabet.Translate(s2);
+ int isym = InputAlphabet.Translate(symbol);
- m_states[s1].transitions[symbol] = s2;
+ Safe.ArgumentAssert(is1 != 0, "s1");
+ Safe.ArgumentAssert(is2 != 0, "s2");
+ Safe.ArgumentAssert(isym != 0, "symbol");
+
+ m_states[is1].transitions[isym] = is2;
}
- protected IDFADefinition Optimize(Func, IDFADefinition> dfaFactory,IAlphabet sourceAlphabet, IAlphabet minimalAlphabet) {
+ #region IDFADefinition implementation
+
+ public DFAStateDescriptior[] GetTransitionTable() {
+ if (m_statesArray == null)
+ m_statesArray = m_states.ToArray();
+ return m_statesArray;
+ }
+
+ public IAlphabet InputAlphabet {
+ get {
+ throw new NotImplementedException();
+ }
+ }
+
+ public IAlphabet StateAlphabet {
+ get {
+ throw new NotImplementedException();
+ }
+ }
+
+ #endregion
+
+ protected IDFADefinition<> Optimize(Func, IDFADefinition> dfaFactory,IAlphabet sourceAlphabet, IAlphabet minimalAlphabet) {
Safe.ArgumentNotNull(dfaFactory, "dfaFactory");
Safe.ArgumentNotNull(minimalAlphabet, "minimalAlphabet");
diff -r 5802131432e4 -r 2a8466f0cb8a Implab/Parsing/DFAStateDescriptor.cs
--- a/Implab/Parsing/DFAStateDescriptor.cs Thu Feb 18 19:38:54 2016 +0300
+++ b/Implab/Parsing/DFAStateDescriptor.cs Fri Feb 19 18:07:17 2016 +0300
@@ -5,9 +5,9 @@
using System.Threading.Tasks;
namespace Implab.Parsing {
- public struct DFAStateDescriptior {
+ public struct DFAStateDescriptior {
public bool final;
- public int[] tag;
+ public TTag[] tag;
public int[] transitions;
}
}
diff -r 5802131432e4 -r 2a8466f0cb8a Implab/Parsing/IAlphabet.cs
--- a/Implab/Parsing/IAlphabet.cs Thu Feb 18 19:38:54 2016 +0300
+++ b/Implab/Parsing/IAlphabet.cs Fri Feb 19 18:07:17 2016 +0300
@@ -12,43 +12,31 @@
///
/// Алфавит является сюрьективным отображением множества символов в множество индексов, это позволяет сократить размер таблицы переходов автомата
/// для входных символов, которые для него не различимы.
- /// Далее символами алфавита будем называть классы исходных символов.
///
/// Тип символов.
public interface IAlphabet {
///
- /// Количество символов в алфавите.
+ /// Количество классов символов в алфавите.
///
int Count { get; }
- ///
- /// Добавляет новый символ в алфавит, если символ уже был добавлен, то
- /// возвращается ранее сопоставленный с символом класс.
- ///
- /// Символ для добавления.
- /// Индекс класса, который попоставлен с символом.
- int DefineSymbol(TSymbol symbol);
+
///
- /// Доабвляем класс символов. Множеству указанных исходных символов
- /// будет сопоставлен символ в алфавите.
- ///
- /// Множестов исходных символов
- /// Идентификатор символа алфавита.
- int DefineClass(IEnumerable symbols);
- ///
- /// Создает карту обратного сопоставления символа алфавита и сопоставленным
+ /// Создает карту обратного сопоставления класса символов алфавита и сопоставленным
/// ему исходным символам.
///
///
List[] CreateReverseMap();
+
///
/// Создает новый алфавит на основе текущего, горппируя его сиволы в более
/// крупные непересекающиеся классы символов.
///
/// Новый, пустой алфавит, в котором быдут определены классы.
/// Множество классов символов текущего алфавита.
- /// Карта для перехода символов текущего
- /// алфавита к символам нового.
- int[] Reclassify(IAlphabet newAlphabet, IEnumerable> classes);
+ /// Карта для перехода классов текущего
+ /// алфавита к классам нового.
+ /// Ползволяет укрупнить алфавит, объединив классы в текущем алфавите. Используется при оптимизации автомата.
+ int[] Reclassify(IAlphabetBuilder newAlphabet, IEnumerable> classes);
///
/// Преобразует входной символ в индекс символа из алфавита.
diff -r 5802131432e4 -r 2a8466f0cb8a Implab/Parsing/IAlphabetBuilder.cs
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/Implab/Parsing/IAlphabetBuilder.cs Fri Feb 19 18:07:17 2016 +0300
@@ -0,0 +1,25 @@
+using System;
+using System.Collections.Generic;
+
+namespace Implab.Parsing {
+ public interface IAlphabetBuilder : IAlphabet {
+ ///
+ /// Добавляет новый символ в алфавит, если символ уже был добавлен, то
+ /// возвращается ранее сопоставленный с символом класс.
+ ///
+ /// Символ для добавления.
+ /// Индекс класса, который попоставлен с символом.
+ int DefineSymbol(TSymbol symbol);
+ ///
+ /// Доабвляем класс символов. Множеству указанных исходных символов
+ /// будет сопоставлен символ в алфавите.
+ ///
+ /// Множестов исходных символов
+ /// Идентификатор символа алфавита.
+ int DefineClass(IEnumerable symbols);
+
+
+
+ }
+}
+
diff -r 5802131432e4 -r 2a8466f0cb8a Implab/Parsing/IDFADefinition.cs
--- a/Implab/Parsing/IDFADefinition.cs Thu Feb 18 19:38:54 2016 +0300
+++ b/Implab/Parsing/IDFADefinition.cs Fri Feb 19 18:07:17 2016 +0300
@@ -6,34 +6,56 @@
namespace Implab.Parsing {
///
- /// Интерфейс для определения ДКА, позволяет добавить состояния и определить переходы.
+ /// Полностью описывает DFA автомат, его поведение, состояние и входные символы.
///
- public interface IDFADefinition {
+ ///
+ /// class MyAutomaton {
+ /// int m_current;
+ /// readonly DFAStateDescriptor[] m_automaton;
+ /// readonly IAlphabet m_commands;
+ ///
+ /// public MyAutomaton(IDFADefinition<MyCommands,MyStates,string> definition) {
+ /// m_current = definition.StateAlphabet.Translate(MyStates.Initial);
+ /// m_automaton = definition.GetTransitionTable();
+ /// m_commands = definition.InputAlphabet;
+ /// }
+ ///
+ /// // defined a method which will move the automaton to the next state
+ /// public void Move(MyCommands cmd) {
+ /// // use transition map to determine the next state
+ /// var next = m_automaton[m_current].transitions[m_commands.Translate(cmd)];
+ ///
+ /// // validate that we aren't in the unreachable state
+ /// if (next == DFAConst.UNREACHABLE_STATE)
+ /// throw new InvalidOperationException("The specified command is invalid");
+ ///
+ /// // if everything is ok
+ /// m_current = next;
+ /// }
+ /// }
+ ///
+ public interface IDFADefinition {
///
- /// Добавляет состояние в автомат.
- ///
- /// Индекс добавленного состояния.
- int AddState();
- ///
- /// Добавляет конечное состояние с указанными метками, если метки не заданы, то
- /// добавленное состояние не будет конечным.
+ /// Алфавит входных символов
///
- /// Метки состояния.
- /// Индекс добавленного состояния.
- int AddState(int[] tags);
+ /// The input alphabet.
+ IAlphabet InputAlphabet {
+ get;
+ }
+
///
- /// Определяет переход между состояниями.
+ /// Алфавит состояний автомата
///
- /// Исходное состояние.
- /// Конечное состояние.
- /// Входной символ.
- void DefineTransition(int s1, int s2, int input);
+ /// The state alphabet.
+ IAlphabet StateAlphabet {
+ get;
+ }
+
///
- /// Размер входного алфавита.
+ /// Таблица переходов состояний автомата
///
- ///
- /// Размер входного алфавита определяет количество возможных выходов из одного состояния.
- ///
- int AlphabetSize { get; }
+ /// The transition table.
+ DFAStateDescriptior[] GetTransitionTable();
+
}
}
diff -r 5802131432e4 -r 2a8466f0cb8a Implab/Parsing/IDFADefinitionBuilder.cs
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/Implab/Parsing/IDFADefinitionBuilder.cs Fri Feb 19 18:07:17 2016 +0300
@@ -0,0 +1,9 @@
+using System;
+
+namespace Implab.Parsing {
+ public interface IDFADefinitionBuilder : IDFADefinition {
+
+
+ }
+}
+
diff -r 5802131432e4 -r 2a8466f0cb8a Implab/Safe.cs
--- a/Implab/Safe.cs Thu Feb 18 19:38:54 2016 +0300
+++ b/Implab/Safe.cs Fri Feb 19 18:07:17 2016 +0300
@@ -9,6 +9,11 @@
{
public static class Safe
{
+ public static void ArgumentAssert(bool condition, string paramName) {
+ if (!condition)
+ throw new ArgumentException("The parameter is invalid", paramName);
+ }
+
public static void ArgumentMatch(string value, string paramName, Regex rx) {
if (rx == null)
throw new ArgumentNullException("rx");