Skip to content

功能详解

这一页按实际界面来介绍 PDF2PPT 的主要功能,而不是按后端模块拆分。

首页

首页是默认工作台,主要负责:

  • 上传 PDF 或单张图片
  • 预览当前文件
  • 选择页码范围
  • 发起转换任务
  • 查看当前任务状态和最近任务

上传与预览

首页主区域是“上传与预览”。

你可以:

  • 拖拽 PDF 或图片到上传区
  • 点击选择文件
  • 预览当前 PDF 页或图片
  • 清空当前文件并重新选择

支持类型:

  • PDF
  • PNG
  • JPG / JPEG
  • WEBP

图片输入会自动包装成单页 PDF 再进入现有流程,所以图片模式下不需要再设置页码范围。

预览区

预览区支持:

  • 当前页输入
  • 上一页 / 下一页切换
  • 读取 PDF 总页数
  • 单张图片直接预览

这里的预览页与“单页试跑”逻辑保持一致,方便先看当前页再决定要不要只跑某几页。

页码范围

如果当前文件是 PDF,首页可以设置页码范围。

常见用法:

  • 整份处理
  • 手动填写起始页和结束页
  • 单页试跑(当前页)

如果页码填写不完整,或者起始页大于结束页,前端会先阻止提交。

常用执行选项

首页保留了少量高频执行选项:

  • 保留过程图 便于核对中间效果和排查问题
  • PPT 生成模式 在速度与效果之间做取舍

当前配置卡片

右侧会显示当前运行时的关键配置摘要,包括:

  • 当前解析链路
  • 当前 OCR 路线
  • 当前 PPT 生成模式
  • 前往设置页继续调整的入口

这里有意只展示必要配置,更细的参数统一放在设置页。

当前任务状态

首页右侧还会显示当前任务概览:

  • 当前状态
  • 当前阶段
  • 简单进度条
  • 队列总数 / 执行中 / 已完成 / 失败数量

如果已经创建任务但还没结束,这里会持续刷新。

最近任务

首页底部显示最近任务列表,便于快速回看:

  • 状态
  • 当前阶段
  • 进度百分比
  • 创建时间

如果需要更细的逐页核对,应进入跟踪页。

跟踪页

跟踪页用于查看任务进度、结果预览和前后对比。

任务列表

左侧任务列表支持:

  • 按任务号或阶段搜索
  • 按状态筛选
  • 查看排队数量
  • 选中某个任务在右侧查看详情

每条任务记录会显示:

  • 短任务号
  • 状态
  • 当前阶段
  • 进度
  • 排队位置或队列状态
  • 最近的错误/提示摘要

常见操作:

  • 跟踪
  • 下载
  • 删除

结果预览

右侧结果区支持:

  • 逐页预览
  • 前后对比
  • 查看任务日志
  • 回看源 PDF

如果该任务保留了视觉产物,页面会自动显示可用页码。

逐页预览

适合单独检查某一页的最终效果,常见可见内容包括:

  • 原始页渲染
  • 清理后背景
  • 最终预览图
  • OCR overlay
  • layout assist 前后图

前后对比

适合快速判断:

  • 清理是否过度
  • 文本替换是否偏移
  • 图片拆分是否合理
  • 最终视觉是否接近原稿

设置页

设置页不是“把所有参数都堆出来”,而是:

  • 常用设置直接展示
  • 高级设置默认收起
  • 不同解析链路只显示相关参数

顶部主要分为三块:

  • 接口配置
  • 处理策略
  • 识别配置

同时支持左侧目录导航和当前分区高亮。

解析引擎

设置页顶部先选解析引擎,这是全局入口。

当前可选包括:

  • 百度解析
  • AIOCR
  • 传统 OCR
  • 云端 MinerU

切换解析引擎后,下面可见的配置会随之变化。

高级参数与诊断

设置页顶部提供统一的“高级参数与诊断”开关。

打开后,才会显示:

  • API 地址覆盖
  • 更细的 OCR 调优项
  • 提示词实验
  • 并发与限流
  • 本地 OCR 检测
  • 阈值与扩边类参数

建议的使用顺序

如果你是第一次使用,可以按这个顺序理解:

  1. 首页先完成上传、预览和启动任务
  2. 跟踪页负责结果核对
  3. 设置页只在需要切路线、补凭据或微调参数时再进入

如果只是追求“先跑通”,不要一开始就展开高级参数。

MIT Licensed