TeamworkGuy2
diff --git a/‎CHANGELOG.md
+19-1 b/‎CHANGELOG.md
+19-1
diff --git a/‎bin/jparse_code-with-tests.jar
-1.08 KB b/‎bin/jparse_code-with-tests.jar
-1.08 KB
diff --git a/‎bin/jparse_code.jar
-1.43 KB b/‎bin/jparse_code.jar
-1.43 KB
diff --git a/‎package-lib.json
+1-1 b/‎package-lib.json
+1-1
diff --git a/‎src/twg2/parser/codeParser/csharp/CsFileTokenizer.java
+31-19 b/‎src/twg2/parser/codeParser/csharp/CsFileTokenizer.java
+31-19
diff --git a/‎src/twg2/parser/codeParser/extractors/AnnotationExtractor.java
+46-41 b/‎src/twg2/parser/codeParser/extractors/AnnotationExtractor.java
+46-41
diff --git a/‎src/twg2/parser/codeParser/extractors/CommentAndWhitespaceExtractor.java
+8-5 b/‎src/twg2/parser/codeParser/extractors/CommentAndWhitespaceExtractor.java
+8-5
diff --git a/‎src/twg2/parser/codeParser/java/JavaFileTokenizer.java
+30-17 b/‎src/twg2/parser/codeParser/java/JavaFileTokenizer.java
+30-17
diff --git a/‎src/twg2/parser/language/CodeLanguageOptions.java
+3-3 b/‎src/twg2/parser/language/CodeLanguageOptions.java
+3-3
diff --git a/‎src/twg2/parser/miscellaneous/MiscellaneousTest.java
-49 b/‎src/twg2/parser/miscellaneous/MiscellaneousTest.java
-49
@@ -4,7 +4,25 @@ This project does its best to adhere to [Semantic Versioning](http://semver.org/
 
 
 --------
-### [0.18.1](N/A) - 2019-07-02
+### [0.19.0](N/A) - 2019-07-04
+#### Changed
+* `IdentifierTokenizer.createIdentifierWithGenericTypeTokenizer()` now takes one parameter `int maxGenericTypeDepth`
+* Changed `CsFileTokenizer.createFileParser()` -> `createCsTokenizers()` and `JavaFileTokenizer.createFileParser()` -> `createJavaTokenizers()`
+* Added some private constructors that throw AssertionError to static classes
+
+#### Removed
+* Changed `GenericTypeTokenizer._createGenericTypeTokenizer()` from public to private
+* Removed `IdentifierTokenizer` field `static int genericTypeDepth` in favor of callers explicitly passing the argument to `createIdentifierWithGenericTypeTokenizer()` which now takes one parameter `int maxGenericTypeDepth`
+* Removed `CodeTokenizerBuilder` in favor of `CodeTokenizer` static methods
+  * Manually build a tokenizer list of type `PairList<CharParserFactory, TextTransformer<CodeTokenType>>`
+  * Call `CodeTokenizer.createTokenizer()` with the language you used to pass to the `CodeTokenizerBuilder` constructor and the list of tokenizers you manually created
+
+#### Fixed
+* `AnnotationExtractor` to handle all C# keyword-followed-by-a-block annotation arguments like `default(T)`, `nameof(T)`, and `typeof(T)`
+
+
+--------
+### [0.18.1](https://github.com/TeamworkGuy2/JParseCode/commit/88ab130b4a6e79bdefa3f071ec64c19e316e91af) - 2019-07-02
 #### Fixed
 * `AnnotationExtractor` to handle C# `typeof(T)` annotation arguments
 
 
@@ -1,5 +1,5 @@
 {
-	"version" : "0.18.1",
+	"version" : "0.19.0",
 	"name" : "jparse-code",
 	"description" : "An in-progress suite of parsing/transpilation tools for C#, Java, and TypeScript code.  Generates simple JSON ASTs.",
 	"homepage" : "https://github.com/TeamworkGuy2/JParseCode",
 
@@ -1,46 +1,58 @@
 package twg2.parser.codeParser.csharp;
 
+import twg2.collections.dataStructures.PairList;
 import twg2.parser.Inclusion;
 import twg2.parser.codeParser.CommentStyle;
 import twg2.parser.fragment.CodeTokenType;
 import twg2.parser.language.CodeLanguageOptions;
+import twg2.parser.textFragment.TextTransformer;
 import twg2.parser.tokenizers.CodeBlockTokenizer;
 import twg2.parser.tokenizers.CodeStringTokenizer;
-import twg2.parser.tokenizers.CodeTokenizerBuilder;
+import twg2.parser.tokenizers.CodeTokenizer;
 import twg2.parser.tokenizers.CommentTokenizer;
 import twg2.parser.tokenizers.IdentifierTokenizer;
 import twg2.parser.tokenizers.NumberTokenizer;
 import twg2.text.tokenizer.CharParserFactory;
 import twg2.text.tokenizer.StringBoundedParserBuilder;
 import twg2.text.tokenizer.StringParserBuilder;
 
+import static twg2.parser.tokenizers.CodeTokenizer.ofType;
+
 /**
  * @author TeamworkGuy2
  * @since 2015-2-9
  */
 public class CsFileTokenizer {
+	public static int maxGenericTypeDepth = 3;
 	public static int cnt = 0;
 
-	public static CodeTokenizerBuilder<CodeLanguageOptions.CSharp> createFileParser() {
-		var identifierParser = IdentifierTokenizer.createIdentifierWithGenericTypeTokenizer();
+
+	public static CodeTokenizer createCsTokenizer() {
+		return CodeTokenizer.createTokenizer(CodeLanguageOptions.C_SHARP, createCsTokenizers());
+	}
+
+
+	public static PairList<CharParserFactory, TextTransformer<CodeTokenType>> createCsTokenizers() {
+		var identifierParser = IdentifierTokenizer.createIdentifierWithGenericTypeTokenizer(maxGenericTypeDepth);
 		var numericLiteralParser = NumberTokenizer.createNumericLiteralTokenizer();
 
-		var parser = new CodeTokenizerBuilder<>(CodeLanguageOptions.C_SHARP)
-			.addParser(CommentTokenizer.createCommentTokenizer(CommentStyle.multiAndSingleLine()), CodeTokenType.COMMENT)
-			.addParser(CodeStringTokenizer.createStringTokenizerForCSharp(), CodeTokenType.STRING)
-			.addParser(CodeBlockTokenizer.createBlockTokenizer('{', '}'), CodeTokenType.BLOCK)
-			.addParser(CodeBlockTokenizer.createBlockTokenizer('(', ')'), CodeTokenType.BLOCK)
-			.addParser(createAnnotationTokenizer(), CodeTokenType.BLOCK)
-			.addParser(identifierParser, (text, off, len) -> {
-				cnt++;
-				// TODO performance
-				return CsKeyword.check.isKeyword(text.toString()) ? CodeTokenType.KEYWORD : CodeTokenType.IDENTIFIER; // possible bad performance
-			})
-			.addParser(createOperatorTokenizer(), CodeTokenType.OPERATOR)
-			.addParser(createSeparatorTokenizer(), CodeTokenType.SEPARATOR)
-			.addParser(numericLiteralParser, CodeTokenType.NUMBER);
-
-		return parser;
+		var parsers = new PairList<CharParserFactory, TextTransformer<CodeTokenType>>();
+
+		parsers.add(CommentTokenizer.createCommentTokenizer(CommentStyle.multiAndSingleLine()), ofType(CodeTokenType.COMMENT));
+		parsers.add(CodeStringTokenizer.createStringTokenizerForCSharp(), ofType(CodeTokenType.STRING));
+		parsers.add(CodeBlockTokenizer.createBlockTokenizer('{', '}'), ofType(CodeTokenType.BLOCK));
+		parsers.add(CodeBlockTokenizer.createBlockTokenizer('(', ')'), ofType(CodeTokenType.BLOCK));
+		parsers.add(createAnnotationTokenizer(), ofType(CodeTokenType.BLOCK));
+		parsers.add(identifierParser, (text, off, len) -> {
+			cnt++;
+			// TODO performance
+			return CsKeyword.check.isKeyword(text.toString()) ? CodeTokenType.KEYWORD : CodeTokenType.IDENTIFIER; // possible bad performance
+		});
+		parsers.add(createOperatorTokenizer(), ofType(CodeTokenType.OPERATOR));
+		parsers.add(createSeparatorTokenizer(), ofType(CodeTokenType.SEPARATOR));
+		parsers.add(numericLiteralParser, ofType(CodeTokenType.NUMBER));
+
+		return parsers;
 	}
 
 
 
@@ -3,7 +3,7 @@
 import java.util.HashMap;
 
 import twg2.ast.interm.annotation.AnnotationSig;
-import twg2.parser.codeParser.csharp.CsKeyword;
+import twg2.collections.interfaces.ListReadOnly;
 import twg2.parser.codeParser.tools.NameUtil;
 import twg2.parser.fragment.CodeToken;
 import twg2.parser.fragment.CodeTokenType;
@@ -64,46 +64,7 @@ public static AnnotationSig parseAnnotationBlock(CodeLanguage lang, CodeTokenTyp
 				}
 
 				// parse the annotation argument value
-				// number: 'Annotation(1)' or 'Annotation(-15)'
-				int num;
-				if((num = DataTypeExtractor.isNumber(param, (i + 1 < size ? paramChilds.get(i + 1).getData() : null))) > 0) {
-					String paramValue = param.getText() + (i + 1 < size && num > 1 ? paramChilds.get(i + 1).getData().getText() : "");
-					params.put(paramName, paramValue);
-					i += (num - 1);
-				}
-				// string: 'Annotation("str")'
-				else if(paramType == CodeTokenType.STRING) {
-					String valueStr = StringTrim.trimQuotes(param.getText());
-
-					// handles concatenated strings 'Annotation(name = 'a' + 'b')
-					if(i + 2 < size && operatorUtil.concatOperators().is(paramChilds.get(i + 1).getData()) && paramChilds.get(i + 2).getData().getTokenType() == CodeTokenType.STRING) {
-						valueStr = valueStr + StringTrim.trimQuotes(paramChilds.get(i + 2).getData().getText());
-						i += 2;
-					}
-
-					params.put(paramName, valueStr);
-				}
-				else if(paramType == CodeTokenType.KEYWORD) {
-					if(param.getText().toUpperCase().contains("TYPEOF")) {
-						System.out.println("test");
-					}
-					// type-literal-keyword: 'Annotation(true)'
-					if(lang.getKeywordUtil().typeLiterals().is(param)) {
-						params.put(paramName, param.getText());
-					}
-					// hack for C# typeof(T) in annotation parameter lists 
-					else if(CsKeyword.TYPEOF.toSrc().equals(param.getText()) && i + 1 < size && CodeTokenType.BLOCK == paramChilds.get(i + 1).getData().getTokenType()) {
-						params.put(paramName, param.getText() + paramChilds.get(i + 1).getData().getText());
-						i++;
-					}
-				}
-				// catches other things like 'Annotation(Integer.TYPE)' or 'Annotation(String.class)'
-				else if(paramType == CodeTokenType.IDENTIFIER) {
-					params.put(paramName, param.getText());
-				}
-				else {
-					throw new IllegalArgumentException("annotation param expected to start with identifier, string, number, or boolean, found " + paramType + " '" + param.getText() + "'");
-				}
+				i += parseAnnotationArgument(lang, param, paramName, paramType, i, size, paramChilds, params);
 			}
 		}
 		// contains just an annotation name, no (arguments...), e.g. 'Annotation'
@@ -117,4 +78,48 @@ else if(paramType == CodeTokenType.IDENTIFIER) {
 		return new AnnotationSig(annotName, NameUtil.splitFqName(annotName), params);
 	}
 
+
+	private static int parseAnnotationArgument(CodeLanguage lang, CodeToken param, String paramName, CodeTokenType paramType, int i, int size, ListReadOnly<SimpleTree<CodeToken>> paramChilds, HashMap<String, String> dstParams) {
+		// number: 'Annotation(1)' or 'Annotation(-15)'
+		int num;
+		if((num = DataTypeExtractor.isNumber(param, (i + 1 < size ? paramChilds.get(i + 1).getData() : null))) > 0) {
+			String paramValue = param.getText() + (i + 1 < size && num > 1 ? paramChilds.get(i + 1).getData().getText() : "");
+			dstParams.put(paramName, paramValue);
+			return (num - 1);
+		}
+		// string: 'Annotation("str")'
+		else if(paramType == CodeTokenType.STRING) {
+			String valueStr = StringTrim.trimQuotes(param.getText());
+
+			// handle concatenated strings 'Annotation(name = 'a' + 'b')
+			if(i + 2 < size && lang.getOperatorUtil().concatOperators().is(paramChilds.get(i + 1).getData()) && paramChilds.get(i + 2).getData().getTokenType() == CodeTokenType.STRING) {
+				valueStr = valueStr + StringTrim.trimQuotes(paramChilds.get(i + 2).getData().getText());
+				dstParams.put(paramName, valueStr);
+				return 2;
+			}
+			else {
+				dstParams.put(paramName, valueStr);
+				return 0;
+			}
+		}
+		// keyword-or-identifier followed by constant-block-expression: 'Annotation(typeof(String))' (for C# default(T), nameof(T), and typeof(T))
+		else if((paramType == CodeTokenType.KEYWORD || paramType == CodeTokenType.IDENTIFIER) && i + 1 < size && CodeTokenType.BLOCK == paramChilds.get(i + 1).getData().getTokenType()) {
+			dstParams.put(paramName, param.getText() + paramChilds.get(i + 1).getData().getText());
+			return 1;
+		}
+		// type-literal-keyword: 'Annotation(true)'
+		else if(paramType == CodeTokenType.KEYWORD && lang.getKeywordUtil().typeLiterals().is(param)) {
+			dstParams.put(paramName, param.getText());
+			return 0;
+		}
+		// catches other things like 'Annotation(Integer.TYPE)' or 'Annotation(String.class)'
+		else if(paramType == CodeTokenType.IDENTIFIER) {
+			dstParams.put(paramName, param.getText());
+			return 0;
+		}
+		else {
+			throw new IllegalArgumentException("annotation param expected to start with identifier, string, number, or boolean, found " + paramType + " '" + param.getText() + "'");
+		}
+	}
+
 }
@@ -5,6 +5,7 @@
 import java.util.EnumSet;
 import java.util.List;
 
+import twg2.collections.dataStructures.PairList;
 import twg2.collections.primitiveCollections.IntArrayList;
 import twg2.collections.primitiveCollections.IntListSorted;
 import twg2.parser.codeParser.CommentStyle;
@@ -13,8 +14,9 @@
 import twg2.parser.fragment.CodeTokenType;
 import twg2.parser.language.CodeLanguage;
 import twg2.parser.textFragment.TextFragmentRef;
+import twg2.parser.textFragment.TextTransformer;
 import twg2.parser.tokenizers.CodeStringTokenizer;
-import twg2.parser.tokenizers.CodeTokenizerBuilder;
+import twg2.parser.tokenizers.CodeTokenizer;
 import twg2.parser.tokenizers.CommentTokenizer;
 import twg2.parser.workflow.CodeFileSrc;
 import twg2.text.stringUtils.StringCheck;
@@ -41,10 +43,11 @@ public static CodeFileSrc buildCommentsAndWhitespaceTree(EnumSet<CommentStyle> s
 		CharParserFactory stringParser = CodeStringTokenizer.createStringTokenizerForJavascript();
 		CharParserFactory commentParser = CommentTokenizer.createCommentTokenizer(style);
 
-		var parser = new CodeTokenizerBuilder<>((CodeLanguage)null)
-			.addParser(commentParser, CodeTokenType.COMMENT)
-			.addParser(stringParser, CodeTokenType.STRING)
-			.build();
+		var parsers = new PairList<CharParserFactory, TextTransformer<CodeTokenType>>();
+		parsers.add(commentParser, CodeTokenizer.ofType(CodeTokenType.COMMENT));
+		parsers.add(stringParser, CodeTokenizer.ofType(CodeTokenType.STRING));
+
+		var parser = CodeTokenizer.createTokenizer((CodeLanguage)null, parsers);
 		return parser.tokenizeDocument(src, srcOff, srcLen, srcName, null);
 	}
 
 
@@ -3,39 +3,52 @@
 import twg2.parser.codeParser.CommentStyle;
 import twg2.parser.fragment.CodeTokenType;
 import twg2.parser.language.CodeLanguageOptions;
+import twg2.parser.textFragment.TextTransformer;
 import twg2.parser.tokenizers.CodeBlockTokenizer;
 import twg2.parser.tokenizers.CodeStringTokenizer;
-import twg2.parser.tokenizers.CodeTokenizerBuilder;
+import twg2.parser.tokenizers.CodeTokenizer;
 import twg2.parser.tokenizers.CommentTokenizer;
 import twg2.parser.tokenizers.IdentifierTokenizer;
 import twg2.parser.tokenizers.NumberTokenizer;
 import twg2.text.tokenizer.CharParserFactory;
 import twg2.text.tokenizer.StringParserBuilder;
 
+import static twg2.parser.tokenizers.CodeTokenizer.ofType;
+
+import twg2.collections.dataStructures.PairList;
+
 /**
  * @author TeamworkGuy2
  * @since 2015-2-9
  */
 public class JavaFileTokenizer {
+	public static int maxGenericTypeDepth = 3;
+
+
+	public static CodeTokenizer createJavaTokenizer() {
+		return CodeTokenizer.createTokenizer(CodeLanguageOptions.C_SHARP, createJavaTokenizers());
+	}
+
 
-	public static CodeTokenizerBuilder<CodeLanguageOptions.Java> createFileParser() {
-		var identifierParser = IdentifierTokenizer.createIdentifierWithGenericTypeTokenizer();
+	public static PairList<CharParserFactory, TextTransformer<CodeTokenType>> createJavaTokenizers() {
+		var identifierParser = IdentifierTokenizer.createIdentifierWithGenericTypeTokenizer(maxGenericTypeDepth);
 		var numericLiteralParser = NumberTokenizer.createNumericLiteralTokenizer();
 
-		var parser = new CodeTokenizerBuilder<>(CodeLanguageOptions.JAVA)
-			.addParser(CommentTokenizer.createCommentTokenizer(CommentStyle.multiAndSingleLine()), CodeTokenType.COMMENT)
-			.addParser(CodeStringTokenizer.createStringTokenizerForJava(), CodeTokenType.STRING)
-			.addParser(CodeBlockTokenizer.createBlockTokenizer('{', '}'), CodeTokenType.BLOCK)
-			.addParser(CodeBlockTokenizer.createBlockTokenizer('(', ')'), CodeTokenType.BLOCK)
-			// no annotation parser, instead we parse
-			.addParser(identifierParser, (text, off, len) -> {
-				return JavaKeyword.check.isKeyword(text.toString()) ? CodeTokenType.KEYWORD : CodeTokenType.IDENTIFIER; // possible bad performance
-			})
-			.addParser(createOperatorTokenizer(), CodeTokenType.OPERATOR)
-			.addParser(createSeparatorTokenizer(), CodeTokenType.SEPARATOR)
-			.addParser(numericLiteralParser, CodeTokenType.NUMBER);
-
-		return parser;
+		var parsers = new PairList<CharParserFactory, TextTransformer<CodeTokenType>>();
+
+		parsers.add(CommentTokenizer.createCommentTokenizer(CommentStyle.multiAndSingleLine()), ofType(CodeTokenType.COMMENT));
+		parsers.add(CodeStringTokenizer.createStringTokenizerForJava(), ofType(CodeTokenType.STRING));
+		parsers.add(CodeBlockTokenizer.createBlockTokenizer('{', '}'), ofType(CodeTokenType.BLOCK));
+		parsers.add(CodeBlockTokenizer.createBlockTokenizer('(', ')'), ofType(CodeTokenType.BLOCK));
+		// no annotation parser, instead we parse
+		parsers.add(identifierParser, (text, off, len) -> {
+			return JavaKeyword.check.isKeyword(text.toString()) ? CodeTokenType.KEYWORD : CodeTokenType.IDENTIFIER; // possible bad performance
+		});
+		parsers.add(createOperatorTokenizer(), ofType(CodeTokenType.OPERATOR));
+		parsers.add(createSeparatorTokenizer(), ofType(CodeTokenType.SEPARATOR));
+		parsers.add(numericLiteralParser, ofType(CodeTokenType.NUMBER));
+
+		return parsers;
 	}
 
 
 
@@ -28,7 +28,7 @@
 import twg2.parser.codeParser.java.JavaFileTokenizer;
 import twg2.parser.codeParser.java.JavaKeyword;
 import twg2.parser.codeParser.java.JavaOperator;
-import twg2.parser.tokenizers.CodeTokenizerBuilder;
+import twg2.parser.tokenizers.CodeTokenizer;
 import twg2.parser.workflow.CodeFileSrc;
 import twg2.parser.workflow.ParseInput;
 
@@ -160,12 +160,12 @@ public static class Java extends CodeLanguageImpl<JavaBlock, JavaKeyword, Java,
 
 	public static final CSharp C_SHARP = registerCodeLanguage(
 		new CSharp("C#", new CsBlockUtil(), new CsAstUtil(), CsKeyword.check, CsOperator.check,
-			CodeTokenizerBuilder.createTokenizerWithTimer(() -> CsFileTokenizer.createFileParser().build()), new CsBlockParser(), Arrays.asList("cs"))
+			CodeTokenizer.createTokenizerWithTimer(() -> CsFileTokenizer.createCsTokenizer()), new CsBlockParser(), Arrays.asList("cs"))
 	);
 
 	public static final Java JAVA = registerCodeLanguage(
 		new Java("Java", new JavaBlockUtil(), new JavaAstUtil(), JavaKeyword.check, JavaOperator.check,
-			CodeTokenizerBuilder.createTokenizerWithTimer(() -> JavaFileTokenizer.createFileParser().build()), new JavaBlockParser(), Arrays.asList("java"))
+			CodeTokenizer.createTokenizerWithTimer(() -> JavaFileTokenizer.createJavaTokenizer()), new JavaBlockParser(), Arrays.asList("java"))
 	);
 
 	public static final CodeLanguageImpl<BlockType, Keyword, CodeLanguage, Operator, AstUtil<BlockType, Keyword>, OperatorUtil<Operator>, AstExtractor<BlockType>> JAVASCRIPT = registerCodeLanguage(
Original file line number	Diff line number	Diff line change
`@@ -1,5 +1,5 @@`
`1`	`1`	`{`
`2`		`- "version" : "0.18.1",`
	`2`	`+ "version" : "0.19.0",`
`3`	`3`	`"name" : "jparse-code",`
`4`	`4`	`"description" : "An in-progress suite of parsing/transpilation tools for C#, Java, and TypeScript code. Generates simple JSON ASTs.",`
`5`	`5`	`"homepage" : "https://github.com/TeamworkGuy2/JParseCode",`