Заменить текст в документе Word с помощью Open Xml

Я создал файл docx из шаблона слова, теперь я обращаюсь к скопированному файлу docx и хочу заменить определенный текст некоторыми другими данными.

Я не могу получить подсказку о том, как получить доступ к тексту из основной части doup?

Любая помощь будет заметна.

Ниже мой код до сих пор.

private void CreateSampleWordDocument()
        //string sourceFile = Path.Combine("D:\\GeneralLetter.dot");
        //string destinationFile = Path.Combine("D:\\New.doc");
        string sourceFile = Path.Combine("D:\\GeneralWelcomeLetter.docx");
        string destinationFile = Path.Combine("D:\\New.docx");
            // Create a copy of the template file and open the copy
            File.Copy(sourceFile, destinationFile, true);
            using (WordprocessingDocument document = WordprocessingDocument.Open(destinationFile, true))
                // Change the document type to Document
                //Get the Main Part of the document
                MainDocumentPart mainPart = document.MainDocumentPart;

Теперь, как найти определенный текст и заменить его? Я не могу получить через Link, поэтому некоторые подсказки кода будут заметны.


Ответ 1

Чтобы дать вам представление о том, как это сделать, попробуйте:

  using ( WordprocessingDocument doc =
                    WordprocessingDocument.Open(@"yourpath\testdocument.docx", true))
                var body = doc.MainDocumentPart.Document.Body;
                var paras = body.Elements<Paragraph>();

                foreach (var para in paras)
                    foreach (var run in para.Elements<Run>())
                        foreach (var text in run.Elements<Text>())
                            if (text.Text.Contains("text-to-replace"))
                                text.Text = text.Text.Replace("text-to-replace", "replaced-text");

Обратите внимание, что текст чувствителен к регистру. После замены форматирование текста не будет изменено. Надеюсь, это поможет вам.

Ответ 2

В дополнение к ответу Flowerking:

Когда в вашем файле Word есть текстовые поля, его решение не будет работать. Поскольку текстовое поле имеет элемент TextBoxContent, поэтому он не будет отображаться в цикле foreach из Run s.

Но при написании

using ( WordprocessingDocument doc =
                    WordprocessingDocument.Open(@"yourpath\testdocument.docx", true))
    var document = doc.MainDocumentPart.Document

    foreach (var text in document.Descendants<Text>()) // <<< Here
        if (text.Text.Contains("text-to-replace"))
            text.Text = text.Text.Replace("text-to-replace", "replaced-text");

он будет зацикливать все тексты в документе (независимо от того, находится он в текстовом поле или нет), поэтому он заменит тексты.

Обратите внимание, что если текст разделен между запусками или текстовыми полями, это также не будет работать. Вам нужно лучшее решение для этих случаев.

Ответ 3

Возможно, это решение проще:
1. a StreamReader читает весь текст,
2. с помощью Regex вы без учета регистра вместо нового текста вместо старого tex 3. a StreamWriter снова записывает измененный текст в документ.

 using (WordprocessingDocument wordDoc = WordprocessingDocument.Open(document, true))
    string docText = null;
    using (StreamReader sr = new StreamReader(wordDoc.MainDocumentPart.GetStream()))
        docText = sr.ReadToEnd();

    foreach (var t in findesReplaces)
        docText = new Regex(findText, RegexOptions.IgnoreCase).Replace(docText, replaceText);

    using (StreamWriter sw = new StreamWriter(wordDoc.MainDocumentPart.GetStream(FileMode.Create)))

Ответ 4

Вот решение, которое может находить и заменять теги в открытом документе xml (word) по всем текстовым прогонам (включая текстовые поля)

namespace Demo
    using System;
    using System.Collections.Generic;
    using System.IO;
    using System.Linq;
    using System.Text.RegularExpressions;
    using DocumentFormat.OpenXml.Packaging;
    using DocumentFormat.OpenXml.Wordprocessing;

    public class WordDocumentHelper
        class DocumentTag
            public DocumentTag()
                ReplacementText = "";

            public string Tag { get; set; }
            public string Table { get; set; }
            public string Column { get; set; }
            public string ReplacementText { get; set; }

            public override string ToString()
                return ReplacementText ?? (Tag ?? "");

        private const string TAG_PATTERN = @"\[(.*?)[\.|\:](.*?)\]";
        private const string TAG_START = @"[";
        private const string TAG_END = @"]";

        /// <summary>
        /// Clones a document template into the temp folder and returns the newly created clone temp filename and path.
        /// </summary>
        /// <param name="templatePath"></param>
        /// <returns></returns>
        public string CloneTemplateForEditing(string templatePath)
            var tempFile = Path.Combine(Path.GetTempPath(), Path.GetRandomFileName()) + Path.GetExtension(templatePath);
            File.Copy(templatePath, tempFile);
            return tempFile;

        /// <summary>
        /// Opens a given filename, replaces tags, and saves. 
        /// </summary>
        /// <param name="filename"></param>
        /// <returns>Number of tags found</returns>
        public int FindAndReplaceTags(string filename)
            var allTags = new List<DocumentTag>();

            using (WordprocessingDocument doc = WordprocessingDocument.Open(path: filename, isEditable: true))
                var document = doc.MainDocumentPart.Document;

                // text may be split across multiple text runs so keep a collection of text objects
                List<Text> tagParts = new List<Text>();

                foreach (var text in document.Descendants<Text>())
                    // search for any fully formed tags in this text run
                    var fullTags = GetTags(text.Text);

                    // replace values for fully formed tags
                    fullTags.ForEach(t => {
                        t = GetTagReplacementValue(t);
                        text.Text = text.Text.Replace(t.Tag, t.ReplacementText);

                    // continue working on current partial tag
                    if (tagParts.Count > 0)
                        // working on a tag
                        var joinText = string.Join("", tagParts.Select(x => x.Text)) + text.Text;

                        // see if tag ends with this block
                        if (joinText.Contains(TAG_END))
                            var joinTag = GetTags(joinText).FirstOrDefault(); // should be just one tag (or none)
                            if (joinTag == null)
                                throw new Exception($"Misformed document tag in block '{string.Join("", tagParts.Select(x => x.Text)) + text.Text}' ");

                            joinTag = GetTagReplacementValue(joinTag);

                            // replace first text run in the tagParts set with the replacement value. 
                            // (This means the formatting used on the first character of the tag will be used)
                            var firstRun = tagParts.First();
                            firstRun.Text = firstRun.Text.Substring(0, firstRun.Text.LastIndexOf(TAG_START));
                            firstRun.Text += joinTag.ReplacementText;

                            // replace trailing text runs with empty strings
                            tagParts.Skip(1).ToList().ForEach(x => x.Text = "");

                            // replace all text up to and including the first index of TAG_END
                            text.Text = text.Text.Substring(text.Text.IndexOf(TAG_END) + 1);

                            // empty the tagParts list so we can start on a new tag
                            // no tag end so keep getting text runs

                    // search for new partial tags
                    if (text.Text.Contains("["))
                        if (tagParts.Any())
                            throw new Exception($"Misformed document tag in block '{string.Join("", tagParts.Select(x => x.Text)) + text.Text}' ");


                // save the temp doc before closing

            return allTags.Count;

        /// <summary>
        /// Gets a unique set of document tags found in the passed fileText using Regex
        /// </summary>
        /// <param name="fileText"></param>
        /// <returns></returns>
        private List<DocumentTag> GetTags(string fileText)
            List<DocumentTag> tags = new List<DocumentTag>();

            if (string.IsNullOrWhiteSpace(fileText))
                return tags;

            // TODO: custom regex for tag matching 
            // this example looks for tags in the formation "[table.column]" or "[table:column]" and captures the full tag, "table", and "column" into match Groups
            MatchCollection matches = Regex.Matches(fileText, TAG_PATTERN);
            foreach (Match match in matches)

                    if (match.Groups.Count < 3
                        || string.IsNullOrWhiteSpace(match.Groups[0].Value)
                        || string.IsNullOrWhiteSpace(match.Groups[1].Value)
                        || string.IsNullOrWhiteSpace(match.Groups[2].Value))

                    tags.Add(new DocumentTag
                        Tag = match.Groups[0].Value,
                        Table = match.Groups[1].Value,
                        Column = match.Groups[2].Value


            return tags;

        /// <summary>
        /// Set the Tag replacement value of the pasted tag
        /// </summary>
        /// <returns></returns>
        private DocumentTag GetTagReplacementValue(DocumentTag tag)
            // TODO: custom routine to update tag Replacement Value

            tag.ReplacementText = "foobar";

            return tag;

Ответ 5

Если текст, который вы ищете, помещается между скобками и Word Разделяет текст в нескольких прогонах...;

Поиск текста (ienumerable (из текста))

for (int i = 0; i <= SearchIn.Count - 1; i++) {

    if (!(i + 2 > SearchIn.Count - 1)) {
        Text TXT = SearchIn(i);
        Text TXT1 = SearchIn(i + 1);
        Text TXT2 = SearchIn(i + 2);

        if (Strings.Trim(TXT.Text) == "[" & Strings.Trim(TXT2.Text) == "]") {
            TXT1.Text = TXT.Text + TXT1.Text + TXT2.Text;

            TXT.Text = "";
            TXT2.Text = "";

Ответ 6

Dim doc As WordprocessingDocument = WordprocessingDocument.Open("Chemin", True, новые OpenSettings с {.AutoSave = True})

Dim d As Document = doc.MainDocumentPart.Document

Dim txt As Text = d.Descendants(Of Text).Where(Function(t) t.Text = "txtNom").FirstOrDefault

If txt IsNot Nothing Then
 txt.Text = txt.Text.Replace("txtNom", "YASSINE OULARBI")
End If


Ответ 7

здесь - это решение из msdn.

Пример оттуда:

public static void SearchAndReplace(string document)
    using (WordprocessingDocument wordDoc = WordprocessingDocument.Open(document, true))
        string docText = null;
        using (StreamReader sr = new StreamReader(wordDoc.MainDocumentPart.GetStream()))
            docText = sr.ReadToEnd();

        Regex regexText = new Regex("Hello world!");
        docText = regexText.Replace(docText, "Hi Everyone!");

        using (StreamWriter sw = new StreamWriter(wordDoc.MainDocumentPart.GetStream(FileMode.Create)))