Подтвердить что ты не робот

Как конвертировать HTML в Markdown при сохранении немаркированных HTML-тегов?

Я хотел бы иметь возможность взять существующий фрагмент HTML и преобразовать его в уценку. Я пробовал pandoc для этой цели:

pandoc test.html -o test.md

где test.html выглядел следующим образом:

Hello

<!-- more -->

and some more text

<h2>some heading</h2>       

В результате получилось следующее:

Hello and some more text

some heading
------------

Таким образом, он не только преобразует теги, которые имеют прямое значение в уценке. Он также удаляет теги, которые я хотел бы сохранить как HTML (например, комментарии HTML, теги iframe и т.д.).

  • Как преобразовать HTML в уценку таким образом, чтобы любые теги, которые не имеют эквивалента в уценке, сохраняются как необработанный HTML?
  • В более общем плане, как я могу контролировать, как выполняется преобразование HTML в уценку?

В частности, меня бы интересовали параметры командной строки. Например, возможно, есть опции, которые могут быть предоставлены pandoc.

4b9b3361

Ответ 1

После немного большего поиска я прочитал о опции --parse-raw в потоке для разбора таблицы.

Добавление опции --parse-raw, казалось бы, не перекрывало эквивалентные HTML-теги без меток.

pandoc test.html -o test.md --parse-raw