markdown-it/lib/parser_block.js

// Block parser


'use strict';


var State           = require('./rules_block/state_block');
var skipEmptyLines  = require('./helpers').skipEmptyLines;
var isEmpty         = require('./helpers').isEmpty;


var rules = [];

// `list` should be after `hr`, but before `heading`
rules.push(require('./rules_block/code'));
rules.push(require('./rules_block/fences'));
rules.push(require('./rules_block/blockquote'));
rules.push(require('./rules_block/hr'));
rules.push(require('./rules_block/list'));
rules.push(require('./rules_block/heading'));
rules.push(require('./rules_block/lheading'));
rules.push(require('./rules_block/htmlblock'));
rules.push(require('./rules_block/table'));
rules.push(require('./rules_block/paragraph'));


function functionName(fn) {
  var ret = fn.toString();
  ret = ret.substr('function '.length);
  ret = ret.substr(0, ret.indexOf('('));
  return ret;
}

function findByName(self, name) {
  for (var i = 0; i < self.rules.length; i++) {
    if (functionName(self.rules[i]) === name) {
      return i;
    }
  }
  return -1;
}


// Block Parser class
//
function ParserBlock() {
  this.rules = [];
  this.rules_named = {};

  for (var i = 0; i < rules.length; i++) {
    this.after(null, rules[i]);
  }
}


// Replace/delete parser function
//
ParserBlock.prototype.at = function (name, fn) {
  var index = findByName(name);
  if (index === -1) {
    throw new Error('Parser rule not found: ' + name);
  }

  if (fn) {
    this.rules[index] = fn;
  } else {
    this.rules = this.rules.slice(0, index).concat(this.rules.slice(index + 1));
  }

  this.rules_named[functionName(fn)] = fn;
};


// Add function to parser chain before one with given name.
// Or add to start, if name not defined
//
ParserBlock.prototype.before = function (name, fn) {
  if (!name) {
    this.rules.unshift(fn);
    this.rules_named[functionName(fn)] = fn;
    return;
  }

  var index = findByName(name);
  if (index === -1) {
    throw new Error('Parser rule not found: ' + name);
  }

  this.rules.splice(index, 0, fn);
  this.rules_named[functionName(fn)] = fn;
};


// Add function to parser chain after one with given name.
// Or add to end, if name not defined
//
ParserBlock.prototype.after = function (name, fn) {
  if (!name) {
    this.rules.push(fn);
    this.rules_named[functionName(fn)] = fn;
    return;
  }

  var index = findByName(name);
  if (index === -1) {
    throw new Error('Parser rule not found: ' + name);
  }

  this.rules.splice(index + 1, 0, fn);
  this.rules_named[functionName(fn)] = fn;
};


// Generate tokens for input range
//
ParserBlock.prototype.tokenize = function (state, startLine, endLine) {
  var ok, i,
      rules = this.rules,
      len = this.rules.length,
      line = startLine,
      hasEmptyLines = false;

  while (line < endLine) {
    state.line = line = skipEmptyLines(state, line, endLine);
    if (line >= endLine) { break; }

    if (state.tShift[line] < state.blkIndent) { break; }
    if (state.bqMarks[line] < state.bqLevel) { break; }

    // Try all possible rules.
    // On success, rule should:
    //
    // - update `state.line`
    // - update `state.tokens`
    // - return true

    for (i = 0; i < len; i++) {
      ok = rules[i](state, line, endLine, false);
      if (ok) { break; }
    }

    if (!ok) { throw new Error('No matching rules found'); }

    if (line === state.line) {
      throw new Error('None of rules updated state.line');
    }

    // set state.tight iff we had an empty line before current tag
    // i.e. latest empty line should not count
    state.tight = !hasEmptyLines;

    // paragraph might "eat" one newline after it in nested lists
    if (isEmpty(state, state.line - 1)) {
      hasEmptyLines = true;
    }

    line = state.line;

    if (line < endLine && isEmpty(state, line)) {
      hasEmptyLines = true;
      line++;

      // two empty lines should stop the parser in list mode
      if (line < endLine && state.listMode && isEmpty(state, line)) { break; }
      state.line = line;
    }
  }
};


ParserBlock.prototype.parse = function (src, options, env) {
  var state, lineStart = 0, lastTabPos = 0;

  if (!src) { return ''; }

  if (src.indexOf('\r') >= 0) {
    src = src.replace(/\r/, '');
  }

  if (src.indexOf('\u00a0') >= 0) {
    src = src.replace(/\u00a0/g, ' ');
  }

  if (src.indexOf('\u2424') >= 0) {
    src = src.replace(/\u2424/g, '\n');
  }

  // TODO: benchmark it
  // Replace tabs with proper number of spaces (1..4)
  if (src.indexOf('\t') >= 0) {
    src = src.replace(/[\n\t]/g, function (match, offset) {
      var result;
      if (src.charCodeAt(offset) === 0x0A) {
        lineStart = offset + 1;
        lastTabPos = 0;
        return match;
      }
      result = '    '.slice((offset - lineStart - lastTabPos) % 4);
      lastTabPos = offset - lineStart + 1;
      return result;
    });
  }


  state = new State(
    src,
    this,
    [],
    options,
    env
  );

  this.tokenize(state, state.line, state.lineMax);

  return state.tokens;

};


module.exports = ParserBlock;
Rename "lexer" to "parser" and move rules from lexer_* to rules_* 10 years ago			`// Block parser`
Added lexer/renderer stubs 10 years ago

			`'use strict';`


Rename "lexer" to "parser" and move rules from lexer_* to rules_* 10 years ago			`var State = require('./rules_block/state_block');`
Moved empty lines logic from rules to block parser 10 years ago			`var skipEmptyLines = require('./helpers').skipEmptyLines;`
Better algorithm for parsing lists 10 years ago			`var isEmpty = require('./helpers').isEmpty;`
Moved empty lines logic from rules to block parser 10 years ago

Added lexer/renderer stubs 10 years ago			`var rules = [];`

Added bullet list stub This is incomplete yet: - one element per list only - list item may contain only one paragraph 10 years ago			// `list` should be after `hr`, but before `heading`
Rename "lexer" to "parser" and move rules from lexer_* to rules_* 10 years ago			`rules.push(require('./rules_block/code'));`
			`rules.push(require('./rules_block/fences'));`
			`rules.push(require('./rules_block/blockquote'));`
			`rules.push(require('./rules_block/hr'));`
			`rules.push(require('./rules_block/list'));`
			`rules.push(require('./rules_block/heading'));`
			`rules.push(require('./rules_block/lheading'));`
			`rules.push(require('./rules_block/htmlblock'));`
			`rules.push(require('./rules_block/table'));`
			`rules.push(require('./rules_block/paragraph'));`
Added lexer/renderer stubs 10 years ago

atx headers + access to named rules via lexers 10 years ago			`function functionName(fn) {`
			`var ret = fn.toString();`
			`ret = ret.substr('function '.length);`
			`ret = ret.substr(0, ret.indexOf('('));`
			`return ret;`
			`}`
Added lexer/renderer stubs 10 years ago
			`function findByName(self, name) {`
			`for (var i = 0; i < self.rules.length; i++) {`
atx headers + access to named rules via lexers 10 years ago			`if (functionName(self.rules[i]) === name) {`
Added lexer/renderer stubs 10 years ago			`return i;`
			`}`
			`}`
			`return -1;`
			`}`


Rename "lexer" to "parser" and move rules from lexer_* to rules_* 10 years ago			`// Block Parser class`
Added lexer/renderer stubs 10 years ago			`//`
Rename "lexer" to "parser" and move rules from lexer_* to rules_* 10 years ago			`function ParserBlock() {`
Added lexer/renderer stubs 10 years ago			`this.rules = [];`
atx headers + access to named rules via lexers 10 years ago			`this.rules_named = {};`
Added lexer/renderer stubs 10 years ago
			`for (var i = 0; i < rules.length; i++) {`
			`this.after(null, rules[i]);`
			`}`
			`}`


Rename "lexer" to "parser" and move rules from lexer_* to rules_* 10 years ago			`// Replace/delete parser function`
Added lexer/renderer stubs 10 years ago			`//`
Rename "lexer" to "parser" and move rules from lexer_* to rules_* 10 years ago			`ParserBlock.prototype.at = function (name, fn) {`
Added lexer/renderer stubs 10 years ago			`var index = findByName(name);`
			`if (index === -1) {`
Rename "lexer" to "parser" and move rules from lexer_* to rules_* 10 years ago			`throw new Error('Parser rule not found: ' + name);`
Added lexer/renderer stubs 10 years ago			`}`

			`if (fn) {`
			`this.rules[index] = fn;`
			`} else {`
			`this.rules = this.rules.slice(0, index).concat(this.rules.slice(index + 1));`
			`}`
atx headers + access to named rules via lexers 10 years ago
			`this.rules_named[functionName(fn)] = fn;`
Added lexer/renderer stubs 10 years ago			`};`


Rename "lexer" to "parser" and move rules from lexer_* to rules_* 10 years ago			`// Add function to parser chain before one with given name.`
Added lexer/renderer stubs 10 years ago			`// Or add to start, if name not defined`
			`//`
Rename "lexer" to "parser" and move rules from lexer_* to rules_* 10 years ago			`ParserBlock.prototype.before = function (name, fn) {`
Added lexer/renderer stubs 10 years ago			`if (!name) {`
			`this.rules.unshift(fn);`
atx headers + access to named rules via lexers 10 years ago			`this.rules_named[functionName(fn)] = fn;`
Added lexer/renderer stubs 10 years ago			`return;`
			`}`

			`var index = findByName(name);`
			`if (index === -1) {`
Rename "lexer" to "parser" and move rules from lexer_* to rules_* 10 years ago			`throw new Error('Parser rule not found: ' + name);`
Added lexer/renderer stubs 10 years ago			`}`

			`this.rules.splice(index, 0, fn);`
atx headers + access to named rules via lexers 10 years ago			`this.rules_named[functionName(fn)] = fn;`
Added lexer/renderer stubs 10 years ago			`};`


Rename "lexer" to "parser" and move rules from lexer_* to rules_* 10 years ago			`// Add function to parser chain after one with given name.`
Added lexer/renderer stubs 10 years ago			`// Or add to end, if name not defined`
			`//`
Rename "lexer" to "parser" and move rules from lexer_* to rules_* 10 years ago			`ParserBlock.prototype.after = function (name, fn) {`
Added lexer/renderer stubs 10 years ago			`if (!name) {`
			`this.rules.push(fn);`
atx headers + access to named rules via lexers 10 years ago			`this.rules_named[functionName(fn)] = fn;`
Added lexer/renderer stubs 10 years ago			`return;`
			`}`

			`var index = findByName(name);`
			`if (index === -1) {`
Rename "lexer" to "parser" and move rules from lexer_* to rules_* 10 years ago			`throw new Error('Parser rule not found: ' + name);`
Added lexer/renderer stubs 10 years ago			`}`

			`this.rules.splice(index + 1, 0, fn);`
atx headers + access to named rules via lexers 10 years ago			`this.rules_named[functionName(fn)] = fn;`
Added lexer/renderer stubs 10 years ago			`};`


			`// Generate tokens for input range`
			`//`
Rename "lexer" to "parser" and move rules from lexer_* to rules_* 10 years ago			`ParserBlock.prototype.tokenize = function (state, startLine, endLine) {`
Added lexer/renderer stubs 10 years ago			`var ok, i,`
			`rules = this.rules,`
			`len = this.rules.length,`
Tight lists + shink start of strings in inline blocks 10 years ago			`line = startLine,`
			`hasEmptyLines = false;`
Added lexer/renderer stubs 10 years ago
Tight lists + shink start of strings in inline blocks 10 years ago			`while (line < endLine) {`
Better algorithm for parsing lists 10 years ago			`state.line = line = skipEmptyLines(state, line, endLine);`
Moved empty lines logic from rules to block parser 10 years ago			`if (line >= endLine) { break; }`
Added lexer/renderer stubs 10 years ago
Reimplement lists using indent algorithm And put blkIndents everywhere appropriate in block rules. 10 years ago			`if (state.tShift[line] < state.blkIndent) { break; }`
Blockquote parsing improved 10 years ago			`if (state.bqMarks[line] < state.bqLevel) { break; }`
Reimplement lists using indent algorithm And put blkIndents everywhere appropriate in block rules. 10 years ago
Added lexer/renderer stubs 10 years ago			`// Try all possible rules.`
			`// On success, rule should:`
			`//`
Tight lists + shink start of strings in inline blocks 10 years ago			// - update `state.line`
Added lexer/renderer stubs 10 years ago			// - update `state.tokens`
			`// - return true`

			`for (i = 0; i < len; i++) {`
atx headers + access to named rules via lexers 10 years ago			`ok = rules[i](state, line, endLine, false);`
Added lexer/renderer stubs 10 years ago			`if (ok) { break; }`
			`}`

Moved empty lines logic from rules to block parser 10 years ago			`if (!ok) { throw new Error('No matching rules found'); }`

Tight lists + shink start of strings in inline blocks 10 years ago			`if (line === state.line) {`
			`throw new Error('None of rules updated state.line');`
Moved empty lines logic from rules to block parser 10 years ago			`}`
Better algorithm for parsing lists 10 years ago
Fix paragraph tightness `state.tight` might be updated in the rules, so we should set it after running rules, not before 10 years ago			`// set state.tight iff we had an empty line before current tag`
			`// i.e. latest empty line should not count`
			`state.tight = !hasEmptyLines;`

Workaround for a bug with nested list elements tightness 10 years ago			`// paragraph might "eat" one newline after it in nested lists`
			`if (isEmpty(state, state.line - 1)) {`
			`hasEmptyLines = true;`
			`}`

			`line = state.line;`

Better algorithm for parsing lists 10 years ago			`if (line < endLine && isEmpty(state, line)) {`
			`hasEmptyLines = true;`
Fix list continuation. It should take indent into account: --- - lev1 - lev2 - next --- 10 years ago			`line++;`
Better algorithm for parsing lists 10 years ago
Remove stopOnTwoNewlines argument in block parser Replaced with block.listMode (boolean) 10 years ago			`// two empty lines should stop the parser in list mode`
			`if (line < endLine && state.listMode && isEmpty(state, line)) { break; }`
Fix list continuation. It should take indent into account: --- - lev1 - lev2 - next --- 10 years ago			`state.line = line;`
Better algorithm for parsing lists 10 years ago			`}`
Added lexer/renderer stubs 10 years ago			`}`
			`};`


Rename "lexer" to "parser" and move rules from lexer_* to rules_* 10 years ago			`ParserBlock.prototype.parse = function (src, options, env) {`
Files reorganize/cleanup 10 years ago			`var state, lineStart = 0, lastTabPos = 0;`

			`if (!src) { return ''; }`

			`if (src.indexOf('\r') >= 0) {`
			`src = src.replace(/\r/, '');`
			`}`

			`if (src.indexOf('\u00a0') >= 0) {`
			`src = src.replace(/\u00a0/g, ' ');`
			`}`

			`if (src.indexOf('\u2424') >= 0) {`
			`src = src.replace(/\u2424/g, '\n');`
			`}`

			`// TODO: benchmark it`
			`// Replace tabs with proper number of spaces (1..4)`
			`if (src.indexOf('\t') >= 0) {`
			`src = src.replace(/[\n\t]/g, function (match, offset) {`
			`var result;`
			`if (src.charCodeAt(offset) === 0x0A) {`
			`lineStart = offset + 1;`
			`lastTabPos = 0;`
			`return match;`
			`}`
			`result = ' '.slice((offset - lineStart - lastTabPos) % 4);`
			`lastTabPos = offset - lineStart + 1;`
			`return result;`
			`});`
			`}`


			`state = new State(`
			`src,`
			`this,`
			`[],`
Parse link reference definitions 10 years ago			`options,`
			`env`
Files reorganize/cleanup 10 years ago			`);`

			`this.tokenize(state, state.line, state.lineMax);`

			`return state.tokens;`

			`};`


Rename "lexer" to "parser" and move rules from lexer_* to rules_* 10 years ago			`module.exports = ParserBlock;`