Описание того, что я собираюсь выполнить:
- Ввод 2 (N не является существенным) HTML-документов.
- Стандартизировать формат HTML
- Разверните два документа - внешние стили не важны, но все, что включено в документ, будет включено.
- Определить дельта на уровне элемента HTML-элемента.
Развертывание последней точки:
Представьте себе две страницы одного и того же сайта, в которых есть общая панель с тем, что было, вероятно, обычным предком, который был скопирован/вставлен. На каждой странице есть некоторые незначительные изменения на боковой панели. Разница покажет эти изменения, затем я могу "подойти" к DOM, чтобы найти первый общий элемент блока, который им поделили, или просто по умолчанию <body>
. В этом случае, я бы хотел подойти и найти это, о, у них есть общий <div id="sidebar">
.
Я знаком с DaisyDiff, и приложение похоже - в мире CMS.
Я также начал играть с библиотекой diff-patch google.
Я хотел бы задать такой неспецифический вопрос, чтобы надеяться, что вы попросите совета или рекомендации, которые, по мнению любого, могут быть полезны. В настоящее время, если вы положили пистолет в голову и сказали "CODE IT", я бы переписал DaisyDiff в Python и добавил эту блочную логику. Но я подумал, может быть, есть лучший способ и ответы на У кого-нибудь есть алгоритм diff для визуализированного HTML? заставляло меня чувствовать себя теплым и нечетким.