Во-первых, я знаю, что уже существует парсер Markdown для PHP. Я также рассмотрел этот вопрос, но он не отвечает на мой вопрос.
Очевидно, даже если заголовок упоминает PHP, если он агностик языка, потому что я хотел бы знать, какой шаг я должен выполнить, чтобы сделать это.
Я читал о PEG, но я должен признать, что я действительно не понял пример, предоставленный с помощью парсера PHP.
Я также читал о CFG.
Я нашел Zend_Markup_Parser_Textile, который, похоже, создает так называемое "дерево токенов" (что об этом?), но в настоящее время непригодный для использования. (Btw, Текстиль не Markdown)
Итак, конкретно, как бы вы пошли на это?
Очевидно, что я использую Regex, но, боюсь.
Поскольку Markdown поддерживает несколько синтаксисов для одного и того же элемента (Setext и atx).
Не могли бы вы дать некоторую отправную точку?