markdown-it/lib/parser_block.js

/** internal
 * class ParserBlock
 *
 * Block-level tokenizer.
 **/
'use strict';


var Ruler           = require('./ruler');


var _rules = [
  [ 'code',       require('./rules_block/code') ],
  [ 'fences',     require('./rules_block/fences'),     [ 'paragraph', 'blockquote', 'list' ] ],
  [ 'blockquote', require('./rules_block/blockquote'), [ 'paragraph', 'blockquote', 'list' ] ],
  [ 'hr',         require('./rules_block/hr'),         [ 'paragraph', 'blockquote', 'list' ] ],
  [ 'list',       require('./rules_block/list'),       [ 'paragraph', 'blockquote' ] ],
  [ 'footnote',   require('./rules_block/footnote'),   [ 'paragraph' ] ],
  [ 'heading',    require('./rules_block/heading'),    [ 'paragraph', 'blockquote' ] ],
  [ 'lheading',   require('./rules_block/lheading') ],
  [ 'htmlblock',  require('./rules_block/htmlblock'),  [ 'paragraph', 'blockquote' ] ],
  [ 'table',      require('./rules_block/table'),      [ 'paragraph' ] ],
  [ 'deflist',    require('./rules_block/deflist'),    [ 'paragraph' ] ],
  [ 'paragraph',  require('./rules_block/paragraph') ]
];


/**
 * new ParserBlock()
 **/
function ParserBlock() {
  /**
   * ParserBlock#ruler -> Ruler
   *
   * [[Ruler]] instance. Keep configuration of block rules.
   **/
  this.ruler = new Ruler();

  for (var i = 0; i < _rules.length; i++) {
    this.ruler.push(_rules[i][0], _rules[i][1], { alt: (_rules[i][2] || []).slice() });
  }
}


// Generate tokens for input range
//
ParserBlock.prototype.tokenize = function (state, startLine, endLine) {
  var ok, i,
      rules = this.ruler.getRules(''),
      len = rules.length,
      line = startLine,
      hasEmptyLines = false;

  while (line < endLine) {
    state.line = line = state.skipEmptyLines(line);
    if (line >= endLine) { break; }

    // Termination condition for nested calls.
    // Nested calls currently used for blockquotes & lists
    if (state.tShift[line] < state.blkIndent) { break; }

    // Try all possible rules.
    // On success, rule should:
    //
    // - update `state.line`
    // - update `state.tokens`
    // - return true

    for (i = 0; i < len; i++) {
      ok = rules[i](state, line, endLine, false);
      if (ok) { break; }
    }

    // set state.tight iff we had an empty line before current tag
    // i.e. latest empty line should not count
    state.tight = !hasEmptyLines;

    // paragraph might "eat" one newline after it in nested lists
    if (state.isEmpty(state.line - 1)) {
      hasEmptyLines = true;
    }

    line = state.line;

    if (line < endLine && state.isEmpty(line)) {
      hasEmptyLines = true;
      line++;

      // two empty lines should stop the parser in list mode
      if (line < endLine && state.parentType === 'list' && state.isEmpty(line)) { break; }
      state.line = line;
    }
  }
};

var TABS_SCAN_RE = /[\n\t]/g;
var NEWLINES_RE  = /\r[\n\u0085]|[\u2424\u2028\u0085]/g;
var SPACES_RE    = /\u00a0/g;
var NULL_RE      = /\u0000/g;

/**
 * ParserBlock.parse(str, options, env, outTokens)
 *
 * Process input string and push block tokens into `outTokens`
 **/
ParserBlock.prototype.parse = function (src, md, env, outTokens) {
  var state, lineStart = 0, lastTabPos = 0;

  if (!src) { return []; }

  // Normalize spaces
  src = src.replace(SPACES_RE, ' ');

  // Normalize newlines
  src = src.replace(NEWLINES_RE, '\n');

  // Strin NULL characters
  src = src.replace(NULL_RE, '');

  // Replace tabs with proper number of spaces (1..4)
  if (src.indexOf('\t') >= 0) {
    src = src.replace(TABS_SCAN_RE, function (match, offset) {
      var result;
      if (src.charCodeAt(offset) === 0x0A) {
        lineStart = offset + 1;
        lastTabPos = 0;
        return match;
      }
      result = '    '.slice((offset - lineStart - lastTabPos) % 4);
      lastTabPos = offset - lineStart + 1;
      return result;
    });
  }

  state = new this.State(src, md, env, outTokens);

  this.tokenize(state, state.line, state.lineMax);
};


ParserBlock.prototype.State = require('./rules_block/state_block');


module.exports = ParserBlock;
Core, ParseBlock, ParseInline minimal docs & minor fixes 10 years ago			`/** internal`
			`* class ParserBlock`
			`*`
			`* Block-level tokenizer.`
			`**/`
Added lexer/renderer stubs 10 years ago			`'use strict';`


Moved rules manager to separate class (block parser only) 10 years ago			`var Ruler = require('./ruler');`

Moved empty lines logic from rules to block parser 10 years ago
Fixed fuckup on minification mangling, related to #89 10 years ago			`var _rules = [`
			`[ 'code', require('./rules_block/code') ],`
			`[ 'fences', require('./rules_block/fences'), [ 'paragraph', 'blockquote', 'list' ] ],`
			`[ 'blockquote', require('./rules_block/blockquote'), [ 'paragraph', 'blockquote', 'list' ] ],`
			`[ 'hr', require('./rules_block/hr'), [ 'paragraph', 'blockquote', 'list' ] ],`
			`[ 'list', require('./rules_block/list'), [ 'paragraph', 'blockquote' ] ],`
Add footnote rules 10 years ago			`[ 'footnote', require('./rules_block/footnote'), [ 'paragraph' ] ],`
Fixed fuckup on minification mangling, related to #89 10 years ago			`[ 'heading', require('./rules_block/heading'), [ 'paragraph', 'blockquote' ] ],`
			`[ 'lheading', require('./rules_block/lheading') ],`
			`[ 'htmlblock', require('./rules_block/htmlblock'), [ 'paragraph', 'blockquote' ] ],`
			`[ 'table', require('./rules_block/table'), [ 'paragraph' ] ],`
Add definition lists 10 years ago			`[ 'deflist', require('./rules_block/deflist'), [ 'paragraph' ] ],`
Fixed fuckup on minification mangling, related to #89 10 years ago			`[ 'paragraph', require('./rules_block/paragraph') ]`
			`];`
Added lexer/renderer stubs 10 years ago

Core, ParseBlock, ParseInline minimal docs & minor fixes 10 years ago			`/**`
			`* new ParserBlock()`
			`**/`
Rename "lexer" to "parser" and move rules from lexer_* to rules_* 10 years ago			`function ParserBlock() {`
Core, ParseBlock, ParseInline minimal docs & minor fixes 10 years ago			`/**`
			`* ParserBlock#ruler -> Ruler`
			`*`
			`* [[Ruler]] instance. Keep configuration of block rules.`
			`**/`
Isolated rules management & rules cache build 10 years ago			`this.ruler = new Ruler();`
Added lexer/renderer stubs 10 years ago
updated eslint to 9.1 & did appropriate changes in sources 10 years ago			`for (var i = 0; i < _rules.length; i++) {`
Fixed fuckup on minification mangling, related to #89 10 years ago			`this.ruler.push(_rules[i][0], _rules[i][1], { alt: (_rules[i][2] \|\| []).slice() });`
Added lexer/renderer stubs 10 years ago			`}`
			`}`


			`// Generate tokens for input range`
			`//`
Rename "lexer" to "parser" and move rules from lexer_* to rules_* 10 years ago			`ParserBlock.prototype.tokenize = function (state, startLine, endLine) {`
Added lexer/renderer stubs 10 years ago			`var ok, i,`
Isolated rules management & rules cache build 10 years ago			`rules = this.ruler.getRules(''),`
			`len = rules.length,`
Tight lists + shink start of strings in inline blocks 10 years ago			`line = startLine,`
			`hasEmptyLines = false;`
Added lexer/renderer stubs 10 years ago
Tight lists + shink start of strings in inline blocks 10 years ago			`while (line < endLine) {`
Moved state helpers to State* classes 10 years ago			`state.line = line = state.skipEmptyLines(line);`
Moved empty lines logic from rules to block parser 10 years ago			`if (line >= endLine) { break; }`
Added lexer/renderer stubs 10 years ago
Clarified comments 10 years ago			`// Termination condition for nested calls.`
			`// Nested calls currently used for blockquotes & lists`
Reimplement lists using indent algorithm And put blkIndents everywhere appropriate in block rules. 10 years ago			`if (state.tShift[line] < state.blkIndent) { break; }`

Added lexer/renderer stubs 10 years ago			`// Try all possible rules.`
			`// On success, rule should:`
			`//`
Tight lists + shink start of strings in inline blocks 10 years ago			// - update `state.line`
Added lexer/renderer stubs 10 years ago			// - update `state.tokens`
			`// - return true`

			`for (i = 0; i < len; i++) {`
atx headers + access to named rules via lexers 10 years ago			`ok = rules[i](state, line, endLine, false);`
Added lexer/renderer stubs 10 years ago			`if (ok) { break; }`
			`}`

Fix paragraph tightness `state.tight` might be updated in the rules, so we should set it after running rules, not before 10 years ago			`// set state.tight iff we had an empty line before current tag`
			`// i.e. latest empty line should not count`
			`state.tight = !hasEmptyLines;`

Workaround for a bug with nested list elements tightness 10 years ago			`// paragraph might "eat" one newline after it in nested lists`
Moved state helpers to State* classes 10 years ago			`if (state.isEmpty(state.line - 1)) {`
Workaround for a bug with nested list elements tightness 10 years ago			`hasEmptyLines = true;`
			`}`

			`line = state.line;`

Moved state helpers to State* classes 10 years ago			`if (line < endLine && state.isEmpty(line)) {`
Better algorithm for parsing lists 10 years ago			`hasEmptyLines = true;`
Fix list continuation. It should take indent into account: --- - lev1 - lev2 - next --- 10 years ago			`line++;`
Better algorithm for parsing lists 10 years ago
Remove stopOnTwoNewlines argument in block parser Replaced with block.listMode (boolean) 10 years ago			`// two empty lines should stop the parser in list mode`
listMode -> parentType 10 years ago			`if (line < endLine && state.parentType === 'list' && state.isEmpty(line)) { break; }`
Fix list continuation. It should take indent into account: --- - lev1 - lev2 - next --- 10 years ago			`state.line = line;`
Better algorithm for parsing lists 10 years ago			`}`
Added lexer/renderer stubs 10 years ago			`}`
			`};`

Perf: regex opts 10 years ago			`var TABS_SCAN_RE = /[\n\t]/g;`
			`var NEWLINES_RE = /\r[\n\u0085]\|[\u2424\u2028\u0085]/g;`
			`var SPACES_RE = /\u00a0/g;`
Strip NULL characters, according to new spec 10 years ago			`var NULL_RE = /\u0000/g;`
Added lexer/renderer stubs 10 years ago
Core, ParseBlock, ParseInline minimal docs & minor fixes 10 years ago			`/**`
			`* ParserBlock.parse(str, options, env, outTokens)`
			`*`
			* Process input string and push block tokens into `outTokens`
			`**/`
Place md link to states and remove other aliases 10 years ago			`ParserBlock.prototype.parse = function (src, md, env, outTokens) {`
Files reorganize/cleanup 10 years ago			`var state, lineStart = 0, lastTabPos = 0;`

Perf: regex opts 10 years ago			`if (!src) { return []; }`
Files reorganize/cleanup 10 years ago
Extended spaces & line breaks normalization 10 years ago			`// Normalize spaces`
Perf: regex opts 10 years ago			`src = src.replace(SPACES_RE, ' ');`
Files reorganize/cleanup 10 years ago
Extended spaces & line breaks normalization 10 years ago			`// Normalize newlines`
Perf: regex opts 10 years ago			`src = src.replace(NEWLINES_RE, '\n');`
Files reorganize/cleanup 10 years ago
Strip NULL characters, according to new spec 10 years ago			`// Strin NULL characters`
			`src = src.replace(NULL_RE, '');`

Files reorganize/cleanup 10 years ago			`// Replace tabs with proper number of spaces (1..4)`
			`if (src.indexOf('\t') >= 0) {`
Perf: regex opts 10 years ago			`src = src.replace(TABS_SCAN_RE, function (match, offset) {`
Files reorganize/cleanup 10 years ago			`var result;`
			`if (src.charCodeAt(offset) === 0x0A) {`
			`lineStart = offset + 1;`
			`lastTabPos = 0;`
			`return match;`
			`}`
			`result = ' '.slice((offset - lineStart - lastTabPos) % 4);`
			`lastTabPos = offset - lineStart + 1;`
			`return result;`
			`});`
			`}`

Place md link to states and remove other aliases 10 years ago			`state = new this.State(src, md, env, outTokens);`
Don't modify env in inline mode 10 years ago
			`this.tokenize(state, state.line, state.lineMax);`
Files reorganize/cleanup 10 years ago			`};`


Place md link to states and remove other aliases 10 years ago			`ParserBlock.prototype.State = require('./rules_block/state_block');`


Rename "lexer" to "parser" and move rules from lexer_* to rules_* 10 years ago			`module.exports = ParserBlock;`