C#提取PPT文本和图片的实现方法
在图文混排的文档中,我们可以根据需要将文档中的文字信息或者图片提取出来,通过C#代码可以提取Word和PDF文件中的文本和图片,那么同样的,我们也可以提取PPT幻灯片当中的文本和图片。本篇文档将讲述如何使用C#来实现提取PPT文本和图片的操作。首先也是需要安装组件Spire.Presentation,然后添加引用dll文件到项目中。下面是主要的代码步骤。
原文档:
1. 提取文本
步骤一:创建一个Presentation实例并加载文档
Presentation presentation = new Presentation(@"C:\Users\Administrator\Desktop\sample.pptx", FileFormat.Pptx2010);
步骤二:创建一个StringBuilder对象
StringBuilder sb = new StringBuilder();
步骤三:遍历幻灯片及幻灯片中的图形,提取文本内容
foreach (ISlide slide in presentation.Slides) { foreach (IShape shape in slide.Shapes) { if (shape is IAutoShape) { foreach (TextParagraph tp in (shape as IAutoShape).TextFrame.Paragraphs) { sb.Append(tp.Text + Environment.NewLine); } } } }
步骤四:写入Txt文档
File.WriteAllText("target.txt", sb.ToString()); Process.Start("target.txt");
2. 提取图片
这里提取图片有两种情况,一种是提取整个文档中的所有图片,另外一种是只提取文档中某一特定幻灯片中的图片。
2.1提取所有图片
步骤一:初始化一个Presentation类实例,并加载文档
Presentation ppt = new Presentation(); ppt.LoadFromFile(@"C:\Users\Administrator\Desktop\sample.pptx");
步骤二:遍历文档中图片,提取图片并保存
for (int i = 0; i < ppt.Images.Count; i++) { Image image = ppt.Images[i].Image; image.Save(string.Format(@"..\..\Images{0}.png", i)); }
提取的图片已保存到项目文件夹下
2.2.提取特定幻灯片中的图片
步骤一:创建一个Presentation类实例,并加载文档
Presentation PPT = new Presentation(); PPT.LoadFromFile(@"C:\Users\Administrator\Desktop\sample.pptx");
步骤二:获取第三张幻灯片,提取并保存图片
int i = 0; foreach (IShape s in PPT.Slides[2].Shapes) { if (s is SlidePicture) { SlidePicture ps = s as SlidePicture; ps.PictureFill.Picture.EmbedImage.Image.Save(string.Format("{0}.png", i)); i++; } if (s is PictureShape) { PictureShape ps = s as PictureShape; ps.EmbedImage.Image.Save(string.Format("{0}.png", i)); i++; } }
提取的第三张幻灯片中的图片已保存至指定位置
上文演示了如何提取文本和图片,步骤比较简单实用,希望对你有所帮助,感谢阅读!
您可能感兴趣的文章
- 01-10C#通过正则表达式实现提取网页中的图片
- 01-10C#提取网页中超链接link和text部分的方法
- 01-10Windows系统中使用C#读取文本文件内容的小示例
- 01-10如何使用C#从word文档中提取图片
- 01-10c#检测文本文件编码的方法
- 01-10C#读写指定编码格式的文本文件
- 01-10学习Winform文本类控件(Label、Button、TextBox)
- 01-10C# FileStream读写的文本操作代码分析
- 01-10解析错误富文本json字符串(带双引号)的快速解决方法
- 01-10C# 向Word中设置/更改文本方向的方法(两种)
阅读排行
本栏相关
- 01-10C#通过反射获取当前工程中所有窗体并
- 01-10关于ASP网页无法打开的解决方案
- 01-10WinForm限制窗体不能移到屏幕外的方法
- 01-10WinForm绘制圆角的方法
- 01-10C#实现txt定位指定行完整实例
- 01-10WinForm实现仿视频播放器左下角滚动新
- 01-10C#停止线程的方法
- 01-10C#实现清空回收站的方法
- 01-10C#通过重写Panel改变边框颜色与宽度的
- 01-10C#实现读取注册表监控当前操作系统已
随机阅读
- 01-11ajax实现页面的局部加载
- 01-10delphi制作wav文件的方法
- 08-05DEDE织梦data目录下的sessions文件夹有什
- 08-05dedecms(织梦)副栏目数量限制代码修改
- 04-02jquery与jsp,用jquery
- 08-05织梦dedecms什么时候用栏目交叉功能?
- 01-10SublimeText编译C开发环境设置
- 01-10C#中split用法实例总结
- 01-11Mac OSX 打开原生自带读写NTFS功能(图文
- 01-10使用C语言求解扑克牌的顺子及n个骰子