Подтвердить что ты не робот

Вложение CSS в С#

Мне нужно встроить css из таблицы стилей в С#.

Как это работает.

http://www.mailchimp.com/labs/inlinecss.php

Css прост, просто классы, нет причудливых селекторов.

Я рассматривал использование регулярного выражения (?<rule>(?<selector>[^{}]+){(?<style>[^{}]+)})+ для удаления правил из css, а затем попытался выполнить простые замены строк, где называются классы, но некоторые из элементов html уже имеют тег стиля, поэтому я бы должны также учитывать это.

Есть ли более простой подход? Или что-то уже написанное в С#?

ОБНОВЛЕНИЕ - 16 сентября 2010 г.

Я смог придумать простой CSS-интерфейс, если ваш html также является действительным xml. Он использует регулярное выражение для получения всех стилей в вашем элементе <style />. Затем преобразует селектор css в выражения xpath и добавляет стиль inline к соответствующим элементам перед любым существующим встроенным стилем.

Обратите внимание, что CssToXpath не полностью реализован, есть некоторые вещи, которые он просто не может сделать... пока.

CssInliner.cs

using System.Collections.Generic;
using System.Text.RegularExpressions;
using System.Xml.Linq;
using System.Xml.XPath;

namespace CssInliner
{
    public class CssInliner
    {
        private static Regex _matchStyles = new Regex("\\s*(?<rule>(?<selector>[^{}]+){(?<style>[^{}]+)})",
                                                RegexOptions.IgnoreCase
                                                | RegexOptions.CultureInvariant
                                                | RegexOptions.IgnorePatternWhitespace
                                                | RegexOptions.Compiled
                                            );

        public List<Match> Styles { get; private set; }
        public string InlinedXhtml { get; private set; }

        private XElement XhtmlDocument { get; set; }

        public CssInliner(string xhtml)
        {
            XhtmlDocument = ParseXhtml(xhtml);
            Styles = GetStyleMatches();

            foreach (var style in Styles)
            {
                if (!style.Success)
                    return;

                var cssSelector = style.Groups["selector"].Value.Trim();
                var xpathSelector = CssToXpath.Transform(cssSelector);
                var cssStyle = style.Groups["style"].Value.Trim();

                foreach (var element in XhtmlDocument.XPathSelectElements(xpathSelector))
                {
                    var inlineStyle = element.Attribute("style");

                    var newInlineStyle = cssStyle + ";";
                    if (inlineStyle != null && !string.IsNullOrEmpty(inlineStyle.Value))
                    {
                        newInlineStyle += inlineStyle.Value;
                    }

                    element.SetAttributeValue("style", newInlineStyle.Trim().NormalizeCharacter(';').NormalizeSpace());
                }
            }

            XhtmlDocument.Descendants("style").Remove();
            InlinedXhtml = XhtmlDocument.ToString();
        }

        private List<Match> GetStyleMatches()
        {
            var styles = new List<Match>();

            var styleElements = XhtmlDocument.Descendants("style");
            foreach (var styleElement in styleElements)
            {
                var matches = _matchStyles.Matches(styleElement.Value);

                foreach (Match match in matches)
                {
                    styles.Add(match);
                }
            }

            return styles;
        }

        private static XElement ParseXhtml(string xhtml)
        {
            return XElement.Parse(xhtml);
        }
    }
}

CssToXpath.cs

using System.Text.RegularExpressions;

namespace CssInliner
{
    public static class CssToXpath
    {
        public static string Transform(string css)
        {
            #region Translation Rules
            // References:  http://ejohn.org/blog/xpath-css-selectors/
            //              http://code.google.com/p/css2xpath/source/browse/trunk/src/css2xpath.js
            var regexReplaces = new[] {
                                          // add @ for attribs
                                          new RegexReplace {
                                              Regex = new Regex(@"\[([^\]~\$\*\^\|\!]+)(=[^\]]+)?\]", RegexOptions.Multiline),
                                              Replace = @"[@$1$2]"
                                          },
                                          //  multiple queries
                                          new RegexReplace {
                                              Regex = new Regex(@"\s*,\s*", RegexOptions.Multiline),
                                              Replace = @"|"
                                          },
                                          // , + ~ >
                                          new RegexReplace {
                                              Regex = new Regex(@"\s*(\+|~|>)\s*", RegexOptions.Multiline),
                                              Replace = @"$1"
                                          },
                                          //* ~ + >
                                          new RegexReplace {
                                              Regex = new Regex(@"([a-zA-Z0-9_\-\*])~([a-zA-Z0-9_\-\*])", RegexOptions.Multiline),
                                              Replace = @"$1/following-sibling::$2"
                                          },
                                          new RegexReplace {
                                              Regex = new Regex(@"([a-zA-Z0-9_\-\*])\+([a-zA-Z0-9_\-\*])", RegexOptions.Multiline),
                                              Replace = @"$1/following-sibling::*[1]/self::$2"
                                          },
                                          new RegexReplace {
                                              Regex = new Regex(@"([a-zA-Z0-9_\-\*])>([a-zA-Z0-9_\-\*])", RegexOptions.Multiline),
                                              Replace = @"$1/$2"
                                          },
                                          // all unescaped stuff escaped
                                          new RegexReplace {
                                              Regex = new Regex(@"\[([^=]+)=([^'|""][^\]]*)\]", RegexOptions.Multiline),
                                              Replace = @"[$1='$2']"
                                          },
                                          // all descendant or self to //
                                          new RegexReplace {
                                              Regex = new Regex(@"(^|[^a-zA-Z0-9_\-\*])(#|\.)([a-zA-Z0-9_\-]+)", RegexOptions.Multiline),
                                              Replace = @"$1*$2$3"
                                          },
                                          new RegexReplace {
                                              Regex = new Regex(@"([\>\+\|\~\,\s])([a-zA-Z\*]+)", RegexOptions.Multiline),
                                              Replace = @"$1//$2"
                                          },
                                          new RegexReplace {
                                              Regex = new Regex(@"\s+\/\/", RegexOptions.Multiline),
                                              Replace = @"//"
                                          },
                                          // :first-child
                                          new RegexReplace {
                                              Regex = new Regex(@"([a-zA-Z0-9_\-\*]+):first-child", RegexOptions.Multiline),
                                              Replace = @"*[1]/self::$1"
                                          },
                                          // :last-child
                                          new RegexReplace {
                                              Regex = new Regex(@"([a-zA-Z0-9_\-\*]+):last-child", RegexOptions.Multiline),
                                              Replace = @"$1[not(following-sibling::*)]"
                                          },
                                          // :only-child
                                          new RegexReplace {
                                              Regex = new Regex(@"([a-zA-Z0-9_\-\*]+):only-child", RegexOptions.Multiline),
                                              Replace = @"*[last()=1]/self::$1"
                                          },
                                          // :empty
                                          new RegexReplace {
                                              Regex = new Regex(@"([a-zA-Z0-9_\-\*]+):empty", RegexOptions.Multiline),
                                              Replace = @"$1[not(*) and not(normalize-space())]"
                                          },
                                          // |= attrib
                                          new RegexReplace {
                                              Regex = new Regex(@"\[([a-zA-Z0-9_\-]+)\|=([^\]]+)\]", RegexOptions.Multiline),
                                              Replace = @"[@$1=$2 or starts-with(@$1,concat($2,'-'))]"
                                          },
                                          // *= attrib
                                          new RegexReplace {
                                              Regex = new Regex(@"\[([a-zA-Z0-9_\-]+)\*=([^\]]+)\]", RegexOptions.Multiline),
                                              Replace = @"[contains(@$1,$2)]"
                                          },
                                          // ~= attrib
                                          new RegexReplace {
                                              Regex = new Regex(@"\[([a-zA-Z0-9_\-]+)~=([^\]]+)\]", RegexOptions.Multiline),
                                              Replace = @"[contains(concat(' ',normalize-space(@$1),' '),concat(' ',$2,' '))]"
                                          },
                                          // ^= attrib
                                          new RegexReplace {
                                              Regex = new Regex(@"\[([a-zA-Z0-9_\-]+)\^=([^\]]+)\]", RegexOptions.Multiline),
                                              Replace = @"[starts-with(@$1,$2)]"
                                          },
                                          // != attrib
                                          new RegexReplace {
                                              Regex = new Regex(@"\[([a-zA-Z0-9_\-]+)\!=([^\]]+)\]", RegexOptions.Multiline),
                                              Replace = @"[not(@$1) or @$1!=$2]"
                                          },
                                          // ids
                                          new RegexReplace {
                                              Regex = new Regex(@"#([a-zA-Z0-9_\-]+)", RegexOptions.Multiline),
                                              Replace = @"[@id='$1']"
                                          },
                                          // classes
                                          new RegexReplace {
                                              Regex = new Regex(@"\.([a-zA-Z0-9_\-]+)", RegexOptions.Multiline),
                                              Replace = @"[contains(concat(' ',normalize-space(@class),' '),' $1 ')]"
                                          },
                                          // normalize multiple filters
                                          new RegexReplace {
                                              Regex = new Regex(@"\]\[([^\]]+)", RegexOptions.Multiline),
                                              Replace = @" and ($1)"
                                          },

                                      };
            #endregion

            foreach (var regexReplace in regexReplaces)
            {
                css = regexReplace.Regex.Replace(css, regexReplace.Replace);
            }

            return "//" + css;
        }
    }

    struct RegexReplace
    {
        public Regex Regex;
        public string Replace;
    }
}

И некоторые тесты

    [TestMethod]
    public void TestCssToXpathRules()
    {
        var translations = new Dictionary<string, string>
                               {
                                   { "*", "//*" }, 
                                   { "p", "//p" }, 
                                   { "p > *", "//p/*" }, 
                                   { "#foo", "//*[@id='foo']" }, 
                                   { "*[title]", "//*[@title]" }, 
                                   { ".bar", "//*[contains(concat(' ',normalize-space(@class),' '),' bar ')]" }, 
                                   { "div#test .note span:first-child", "//div[@id='test']//*[contains(concat(' ',normalize-space(@class),' '),' note ')]//*[1]/self::span" }
                               };

        foreach (var translation in translations)
        {
            var expected = translation.Value;
            var result = CssInliner.CssToXpath.Transform(translation.Key);

            Assert.AreEqual(expected, result);
        }
    }

    [TestMethod]
    public void HtmlWithMultiLineClassStyleReturnsInline()
    {
        #region var html = ...
        var html = XElement.Parse(@"<html>
                                        <head>
                                            <title>Hello, World Page!</title>
                                            <style>
                                                .redClass { 
                                                    background: red; 
                                                    color: purple; 
                                                }
                                            </style>
                                        </head>
                                        <body>
                                            <div class=""redClass"">Hello, World!</div>
                                        </body>
                                    </html>").ToString();
        #endregion

        #region const string expected ...
        var expected = XElement.Parse(@"<html>
                                            <head>
                                                <title>Hello, World Page!</title>
                                            </head>
                                            <body>
                                                <div class=""redClass"" style=""background: red; color: purple;"">Hello, World!</div>
                                            </body>
                                        </html>").ToString();
        #endregion

        var result = new CssInliner.CssInliner(html);

        Assert.AreEqual(expected, result.InlinedXhtml);
    }

Есть больше тестов, но они импортируют html файлы для ввода и ожидаемого вывода, и я не публикую все это!

Но я должен опубликовать методы расширения Normalize!

private static readonly Regex NormalizeSpaceRegex = new Regex(@"\s{2,}", RegexOptions.None);
public static string NormalizeSpace(this string data)
{
    return NormalizeSpaceRegex.Replace(data, @" ");
}

public static string NormalizeCharacter(this string data, char character)
{
    var normalizeCharacterRegex = new Regex(character + "{2,}", RegexOptions.None);
    return normalizeCharacterRegex.Replace(data, character.ToString());
}
4b9b3361

Ответ 1

Поскольку вы уже на 90% работаете с вашей текущей реализацией, почему бы вам не использовать существующую инфраструктуру, а вместо этого заменить синтаксический анализ XML на парсер HTML? Один из наиболее популярных из них - HTML Agility Pack. Он поддерживает запросы XPath и даже имеет интерфейс LINQ, похожий на стандартный интерфейс .NET для XML, поэтому он должен быть довольно простой заменой.

Ответ 2

У меня есть проект Github, который делает CSS встроенным. Это очень просто и поддерживает мобильные стили. Подробнее читайте в моем блоге: http://martinnormark.com/move-css-inline-premailer-net

Ответ 3

Отличный вопрос.

Я понятия не имею, есть ли .NET-решение, но я нашел программу Ruby под названием Premailer, который претендует на встроенный CSS. Если вы хотите использовать его, у вас есть несколько вариантов:

  • Rewrite Premailer на С# (или любой язык .NET, с которым вы знакомы)
  • Используйте IronRuby для запуска Ruby в .NET.

Ответ 4

Я бы рекомендовал использовать фактический синтаксический анализатор CSS, а не Regexes. Вам не нужно анализировать полный язык, поскольку вы заинтересованы в основном в воспроизведении, но в любом случае такие синтаксические анализаторы доступны (и для .NET тоже). Например, просмотрите список грамматик в частности CSS 2.1 grammar или грамматику CSS3. Вы можете лишить большие части обоих грамматик, если не возражают субоптимальные результаты, в которых встроенные стили могут включать в себя повторяющиеся определения, но для этого вам нужно некоторое представление о внутренней логике CSS, чтобы иметь возможность разрешать сокращенные атрибуты.

Однако в долгосрочной перспективе это, безусловно, будет намного меньше работы, чем бесконечная серия исправлений регулярного выражения adhoc.

Ответ 5

Вот идея, почему вы не делаете почтовый вызов http://www.mailchimp.com/labs/inlinecss.php с помощью С#. из анализа с использованием firebug похоже, что для постсообщения требуется 2 параметра html и strip, который принимает значения (вкл./выкл.), результат находится в параметре, называемом текстом.

вот пример того, как сделать пост-вызов с помощью С#

Ответ 6

Чад, вам обязательно нужно добавить встроенный CSS? Или вы могли бы быть лучше, добавив блок <style> к вашему <head>? Это, по сути, заменит необходимость ссылки на файл CSS, а также поддержит правило, согласно которому фактические встроенные правила переопределяют те, которые установлены в файле css с заголовком/ссылкой.

(извините, забыли добавить котировки для кода)

Ответ 7

Я бы порекомендовал такой диктатор:

private Dictionary<string, Dictionary<string, string>> cssDictionary = new Dictionary<string, Dictionary<string, string>();

Я бы проанализировал css, чтобы заполнить этот cssDictionary.

(добавление "style-type", "style-property", "value". В примере:

Dictionary<string,string> bodyStyleDictionary = new Dictionary<string, string();
    bodyStyleDictionary.Add("background", "#000000");
    cssDictionary.Add("body", bodyStyleDictionary);

После этого я бы предпочла преобразовать HTML в XmlDocument.

Вы можете рекурсивно запускать через узлы документов его дочерние элементы, а также искать его родителей (это даже позволило бы вам использовать селекторы).

В каждом элементе вы проверяете тип элемента, id и класс. Затем вы просматриваете cssDictionary, чтобы добавить стили для этого элемента в атрибут стиля. Конечно, вы можете поместить их в порядке появления, если у них есть перекрывающиеся свойства (и добавьте существующие встроенные стили последние).

Когда вы закончите, вы выпустите xmlDocument как строку и удалите первую строку (<?xml version="1.0"?>). Это должно оставить вам действительный html-документ со встроенным css.

Конечно, это может выглядеть наподобие взлома, но в конце концов я считаю это довольно солидным решением, которое обеспечивает стабильность и делает то, что вы, похоже, ищете.

Ответ 8

Поскольку этот вариант не очень ясен в других ответах, я думаю, что он заслуживает прямого ответа.

Используйте PreMailer.Net.

Все, что вам нужно сделать, это:

  • Установите PreMailer.NET через nuget.
  • Введите это:

    var inlineStyles = PreMailer.Net.PreMailer.MoveCssInline(htmlSource, false);
    destination = inlineStyles.Html;
    

И все готово!

Кстати, вы можете добавить директиву using, чтобы сократить эту строку.

Дополнительная информация об использовании в приведенной выше ссылке, конечно.