从 HTML 里取出表格数据,不必再手工重建整张表
报表仍以网页形式出现:供应商门户导出、夜间任务发来的 HTML 邮件、从内部仪表盘复制的价目块。你要的是电子表格里的行,或脚本用的扁平 `.csv`——不是又一个要逐格复制的浏览器标签页。 从渲染页直接复制粘贴,往往在这里翻车:合并表头塌成一行,货币符号进错列,屏幕上整齐的表在 A 列挤成一条长串。靠谱的 HTML 转 CSV 流程,应给出能在 Excel、Google 表格或 pandas 里打开的逗号分隔值,而不是一场事后清洗。 转换器在浏览器里运行。左侧贴标记,右侧看解析后的网格;解析漏了行就改单元格或改源 HTML,只要扁平数据就下 `.csv`,要保留合并或多工作表就选 `.xlsx` / `.xls`。不会发到我们的服务器——表里若有客户姓名或未公开数字,这一点尤其值得记住。

表格提取与全文提取,导出前可编辑的网格
多数一键工具默认你只有一张规整的 `<table>`。真实页面更乱:前面一段说明、后面才是数字;一次导出里有两张表;`<thead>` 用 `colspan` 做分组列。因此我们做了两种提取模式。 **表格提取**把语义化的 `<table>` 标记变成真正的行列——表头、数据行,以及 `colspan` / `rowspan` 映射到预览里的合并区域。数据确实在 table 标签里时,要把 HTML 表格转成 CSV,应选这一种。 **全文提取**按页面结构——标题、段落、列表——逐块处理,每块占单列一行,同时把内嵌表格展开成多列行。适合 HTML 以正文为主、中间夹着表,或想把可读文字和表格数据放进同一文件的场景。
与「上传—等待」型转换器不同,这里是左右对照的工作台:HTML 编辑器和预览同屏。某行不对?在网格里点单元格改值,或回到 HTML 标签补上缺的 `<th>`、闭合标签、去掉多余的 `div`——预览会刷新。不必在盲转之后再猜导出长什么样。 导入任务只要扁平文件,在格式菜单选 `.csv`;要合并元数据,或一次粘贴里有多张表要分工作表,选 `.xlsx` 或旧版 `.xls`。预览和编辑不变,变的只是下载格式。
试用转换器两种提取模式,一个粘贴框
`<table>` 数据用表格提取,图文混排页用全文提取——不会被单一解析器按同一种规则硬套。
网格和 HTML 都能就地改
在预览里改数值,或结构不对时改左侧标记。两栏同步更新,下载的 CSV 与核对结果一致。
下载前先预览
表头、数字列、合并区域导出前可见,减少在表格软件或脚本里打开时的意外。
在这里做 HTML 转 CSV 能得到什么
左右对照的编辑器与预览——不是吐出一段无法核对的黑盒文本。

为什么「粘贴 + 预览」比只能上传更实用
分析师往往已有标记——从检查器、CMS 保存页或邮件模板复制。强制上传多一步,有时还会丢掉你真正要的片段。这里优先粘贴;剪贴板装不下时再导入 `.html` / `.htm`。 预览是另一半价值。做 HTML 转 CSV 时,列对齐是命根子:表头错位会破坏 VLOOKUP 和导入脚本。导出前看见网格,HTML 还开在旁边,就能发现缺列或重复表头。 页面里有多张顶层表格时,预览里各成一张工作表。在工具栏切换工作表、逐块核对再导出。单表、直白的 HTML 表格转 CSV,选 `.csv` 即可得到一份可直接导入的逗号分隔文件。
如何将 HTML 文件转换为 CSV 格式

粘贴或导入 HTML
在左侧编辑器放入代码——多数人直接从剪贴板粘贴。完整保存页用「上传」导入 `.html` / `.htm`。数据在 `<table>` 里选 **表格提取**;段落与表格混排选 **全文提取**。

核对预览网格
右侧面板显示即将导出的行。检查表头、数字和合并单元格。HTML 里有多张表时,在工具栏选工作表。点单元格改笔误,或回 HTML 标签改结构。

选择 CSV(或其他格式)
格式下拉选 `.csv` 得到扁平逗号分隔文件——适合导入和脚本。CSV 不保存合并信息;若 colspan 版式必须保留,用 `.xlsx` 或 `.xls`。预览方式相同。

下载并使用
点击「下载」。在表格软件打开 `.csv`,或交给 ETL 流水线。日后若又要标记,可从转换菜单用 Excel 转 HTML 走回程。
HTML 转 CSV:导出前常见问题
把下一张 HTML 表,变成能用的 CSV
粘贴、预览、改单元格或改标记再下载——不必重打整张网格。
HTML 转 CSV
- 粘贴 HTML 或导入文件——导出前可预览
- 表格提取与全文提取两种模式
- 可编辑网格单元格,或修改左侧 HTML
- 从工具栏下载 `.csv`、`.xlsx`、`.xls`
又要从表格回到标记?请用转换菜单里的 Excel 转 HTML。

少做复制粘贴后的修补
把网页表格变成可筛选、可导入的扁平文件,不必手工重建每一行。
