文档星空最火知名网站>>Spire.Doc系列教程>>Spire.Doc系列教程(13):根据分节符和分页符拆分 Word 文档
Spire.Doc系列教程(13):根据分节符和分页符拆分 Word 文档
在Word文档中,我们可以通过最简单的方法来拆分Word文档,那就是打开一个是需要拆分的文档的副本,删除我们不需要的内容然后将剩余内容保存为新文档到本地。虽然操作简单,但是一节一节的删除是个相当繁琐且枯燥的过程。利用Spire.Doc,我们可以程序化的根据分节符和分页符来拆分Word文档,这避免了手动冗杂的操作。本文将对此做详细介绍。
根据分节符拆分文档
//实例化Document对象
Document document = new Document();
//载入待拆分的Word文档
document.LoadFromFile(@"测试文档.docx");
Document newWord;
for (int i = 0; i < document.Sections.Count; i++)
{
//每有一个section就创建一个新的文档
newWord = new Document();
//复制section内容到新文档
newWord.Sections.Add(document.Sections[i].Clone());
//保存文档
newWord.SaveToFile(String.Format(@"拆分结果\分节符拆分的结果文档_{0}.docx", i));
}
原文档如图,其中有两个分节符:

运行程序得到如下结果:

根据分页符拆分文档
//实例化Document对象
Document original = new Document();
//载入待拆分的Word文档
original.LoadFromFile(@"C:\Users\Administrator\Desktop\template.docx");
//实例化一个新的文档并添加新章节
Document newWord = new Document();
Section section = newWord.AddSection();
int index = 0;
//根据章节,段落的层次由大到小依次遍历文档元素,复制内容到新的文档
foreach (Section sec in original.Sections)
{
foreach (DocumentObject obj in sec.Body.ChildObjects)
{
if (obj is Paragraph)
{
Paragraph para = obj as Paragraph;
section.Body.ChildObjects.Add(para.Clone());
foreach (DocumentObject parobj in para.ChildObjects)
{
//找到段落中的分页符,保存到新文档
if (parobj is Break && (parobj as Break).BreakType == BreakType.PageBreak)
{
int i = para.ChildObjects.IndexOf(parobj);
section.Body.LastParagraph.ChildObjects.RemoveAt(i);
newWord.SaveToFile(String.Format(@"C:\Users\Administrator\Desktop\拆分结果\分页符拆分的结果文档_{0}.docx", index), FileFormat.Docx);
index++;
//一个文档完成之后新建一个文档
newWord = new Document();
section = newWord.AddSection();
//复制上一个分页符所在的段落的所有内容到新文档
section.Body.ChildObjects.Add(para.Clone());
//如果新文档第一段(也就是刚刚复制的那一段)没有子元素,
//则把文档的第一个子元素删除
if (section.Paragraphs[0].ChildObjects.Count == 0)
{
section.Body.ChildObjects.RemoveAt(0);
}
else
{
//如果有内容则删除分页符之前的所有内容
while (i >= 0)
{
section.Paragraphs[0].ChildObjects.RemoveAt(i);
i--;
}
}
}
}
}
if (obj is Table)
{
section.Body.ChildObjects.Add(obj.Clone());
}
}
}
newWord.SaveToFile(String.Format(@"C:\Users\Administrator\Desktop\拆分结果\分页符拆分的结果文档_{0}.docx", index), FileFormat.Docx);
原文档如图,其中有一个分页符:

运行程序得到如下结果:


QQ交谈
在线咨询

渝公网安备
50010702500608号

客服热线