支持。OCR 模式可以提取图片中 32 种语言的所有可见文字——截图、文档、收据、标牌、手写笔记等。会尽量保留布局，并能解释提取文字的上下文。

我的上传文件会被存储吗？

这由「保存到我的描述」开关控制。关闭保存时，上传文件只用于本次处理，结果只显示在当前页面；刷新后会丢失，我们不会保存到历史记录。开启保存时，结果会私密保存到「我的描述」，只有你的账号可以查看或删除。未登录用户的上传是临时的，会自动清理。

AI 图片与视频理解

Describe Image
AI 图片描述生成器

上传图片或短视频，将它们转换为详细描述、Alt 文本、OCR 文字、SEO 文案、社交标题、AI 提示词和可直接用于工作的审阅笔记。

描述图片查看示例

图片描述OCR 与 Alt 文本SEO 文案与社交标题提示词与视频笔记

试用 AI 图片描述生成器

上传图片，选择模式，几秒内获得结果。

真实 AI 图片描述示例

16 个真实提示词和 AI 输出，可以滚动每张卡片，或点击打开完整结果。

AI 图片描述

图片 → AI 图片描述

一瓶琥珀色香水放在阳光照射的大理石桌面上，旁边有粉色牡丹和婴儿满天星，画面呈现温暖、优雅、宁静的氛围。主体：方形玻璃香水瓶，瓶身内有琥珀色液体，顶部是透明切面瓶盖，旁边摆放粉色花朵和白色小花。视觉氛围：暖色阳光从侧面照入，浅景深让背景柔和虚化，整体像高端香水静物摄影，干净、柔和、有精致感。

查看提示词和输出

SEO 元数据

产品图 → SEO 元数据

1. SEO 图片标题：白色透气跑鞋 2. Alt 文本：一只白色透气跑鞋，带网面鞋面和缓震鞋底，整体设计简洁轻量。 3. 图片描述：这是一款白色运动跑鞋，鞋面呈透气网眼材质，鞋底厚实并带有缓震结构，适合突出轻便、舒适、日常运动和简约穿搭等关键词。 4. 建议文件名： white-breathable-running-shoe.jpg 5. 关键词：白色跑鞋、透气跑鞋、网面运动鞋、轻量跑鞋、缓震鞋底、日常运动鞋、简约运动鞋、白色透气跑鞋 6. 网页短标题：白色透气跑鞋，适合日常运动与轻便穿搭。

查看提示词和输出

Alt 文本

图片 → 无障碍 Alt 文本

Alt 文本：一只佩戴导盲犬牵引装备的金毛犬坐在人行横道旁，背景显示城市街道环境。长说明：一只佩戴导盲犬牵引装备的金毛犬坐在人行横道旁，背景显示城市街道环境，有助于说明它作为服务犬的场景和用途。装饰图建议：否。无障碍说明：这段文本说明了主体、关键装备和街道场景，能帮助使用屏幕阅读器的用户理解图片的功能性含义。

查看提示词和输出

电商文案

商品图 → 电商商品文案

1. 商品标题：米色通勤托特包，配金色五金与手提/肩背设计 2. 简短副标题：适合上班、出行和日常搭配的简约女包 3. 卖点： - 米色外观简洁耐看，容易搭配通勤和休闲造型。 - 手提与肩背两种携带方式，适合不同使用场景。 - 金色五金增加精致感，提升整体质感。 - 包型挺括，适合收纳日常随身物品。 - 风格低调优雅，适合办公室、旅行和日常出门。 4. 商品描述：这款米色托特包采用简洁挺括的包型设计，搭配金色五金细节，整体呈现优雅、实用的通勤风格。它既可以手提，也可以肩背，适合办公、购物、出差或日常搭配。柔和的米色外观不挑穿搭，能够自然融入多种衣橱风格。 5. 建议类目：女包 > 托特包 > 通勤手提包 6. 目标用户：适合需要日常通勤包、商务手提包或简约百搭女包的用户。 7. SEO 关键词：米色托特包、通勤女包、手提包、商务包、日常搭配包、肩背包、金色五金包 8. 平台商品文案：用一只简洁米色托特包完成日常通勤搭配。挺括包型、金色五金和手提/肩背设计，让它适合办公室、周末出行和轻商务场景。 #托特包 #米色手提包 #商务通勤包 #女包 #日常搭配 #肩背包 #简约女包

查看提示词和输出

OCR + 布局

收据 -> 结构化文本

1. 完整 OCR 文本： MAPLE GROVE MARKET 1234 Oakwood Drive Portland, OR 97205 (503) 555-0198 Date: May 12, 2024 Time: 2:34 PM Transaction ID: MGMT-52412-00387 Cashier: Sarah J. 商品包括 Organic Bananas、Whole Milk、Sourdough Bread、Cage Free Eggs、Greek Yogurt、Honeycrisp Apples、Almond Butter。 Subtotal $30.95 Tax (8%) $2.48 TOTAL $33.43 Payment Method: Visa **** **** **** 4242 Approval Code: 083947 2. 布局结构：这是一张超市收据，顶部是店铺信息，中部是交易时间和商品明细，底部是小计、税费、总额和支付方式。 3. 关键字段：店铺：MAPLE GROVE MARKET 日期：May 12, 2024 时间：2:34 PM 交易编号：MGMT-52412-00387 收银员：Sarah J. 总额：$33.43 4. 总结：这张收据记录了一次食品杂货购物，支付方式为 Visa，整体文字清晰，适合整理成报销或记账记录。

查看提示词和输出

图表分析

仪表盘 -> 通俗解释

1. 图表展示内容：这是一张业务数据看板，展示收入、订单、客户、转化率、地区表现、产品销售和订单状态等指标。 2. 主要趋势：整体业务表现向好，收入和订单量上升，新客户增长明显，但转化率略有下降。 3. 关键数字：总收入约 245 万美元，订单量 12,842，新客户 2,356，平均订单价值约 190.74 美元，转化率为 3.68%。 4. 需要关注：转化率下降可能需要排查页面、流量质量或结账流程。Middle East & Africa 区域表现较弱，也值得单独分析。 5. 简短总结：这张看板说明业务正在增长，但仍需要关注转化率和部分地区的低表现。

查看提示词和输出

社交媒体标题

照片 -> 社交媒体标题

1. Instagram 文案：阳光、冰咖啡和城市街角的慢节奏，今天的好心情从这一口开始。 #冰咖啡 #城市生活 #咖啡时刻 #夏日氛围 2. X/Twitter 文案：在热闹街边喝一杯冰咖啡，把忙碌暂停几分钟。 #咖啡 #CityLife 3. LinkedIn 文案：高效工作也需要片刻留白。城市街角的一杯咖啡，常常是重新整理思路的开始。 4. TikTok 短文案：冰咖啡 + 阳光街角 = 今日快乐公式。 5. 相关标签： #冰咖啡 #咖啡时刻 #城市街拍 #夏日饮品 #慢生活 #户外咖啡 #日常记录

查看提示词和输出

UI 转代码

UI 截图 -> 前端代码

1. 布局结构：这是一个典型后台仪表盘界面，左侧是垂直导航栏，顶部是搜索和用户操作区，主区域包含指标卡、图表卡和订单表格。 2. 主要组件：侧边栏导航、搜索框、通知按钮、用户头像、收入/订单/客户/转化率指标卡、折线图、环形图、产品排行、最近订单表格。 3. 前端实现建议：使用 CSS Grid 搭建整体布局，侧边栏固定宽度，主内容区自适应。指标卡使用统一卡片组件，图表区域可接入 Chart.js 或 Recharts，表格保持列宽和状态标签的一致性。 4. 响应式行为：桌面端保持侧边栏常驻；平板和手机端将侧边栏折叠为抽屉，指标卡从四列变为两列或一列，表格支持横向滚动。 5. 视觉注意事项：整体以白色、浅灰和蓝色为主，间距克制，状态颜色需区分增长、下降、处理中和取消等含义。

查看提示词和输出

视频摘要

短视频 -> 场景拆解

| 时间段 | 画面内容 | 主要主体 | 可见文字/标志 | 总结 | |---|---|---|---|---| | 0:00-0:02 | 繁忙城市广场的远景，一匹马从右侧进入画面，周围有车辆和行人。 | 马、行人、汽车、公交车、建筑 | Coca-Cola、KODAK 等广告牌 | 马进入热闹街区。 | | 0:03-0:05 | 马继续向左移动，红色双层巴士从背景经过，行人穿行。 | 马、行人、红色双层巴士 | 多个街头广告牌 | 画面呈现城市交通和街头人流。 | | 0:06-0:09 | 镜头跟随马向左，马接近画面边缘。 | 马、路人、车辆 | 广场广告和店招 | 短片突出一匹马在繁忙城市环境中的平静移动。 |

查看提示词和输出

物体检测

照片 -> 物体清单

1. 主要主体：一只金毛犬坐在公园步道旁，姿态安静、注意力集中。 2. 可识别物体：木质长椅、蓝色水瓶、黑色背包、自行车、郁金香花坛、树木、铺砖步道、远处行人。 3. 背景细节：画面位于绿树成荫的公园，阳光穿过树叶形成斑驳光影，花坛颜色明亮，整体氛围轻松自然。 4. 物体类别：动物、户外家具、交通工具、随身物品、植物、人物、公共空间。 5. 总结：这是一张公园生活照片，展示金毛犬、长椅、自行车和鲜花步道，适合用于宠物、户外生活或城市绿地相关内容。

查看提示词和输出

文档 -> JSON

发票 -> 结构化 JSON

文档类型：INVOICE 供应商：Summit Peak Solutions, LLC 发票编号：INV-2024-05781 日期：May 15, 2024 客户：Brighton Financial Group, Accounts Payable 地址：2100 Market Street, Suite 500, Philadelphia, PA 19103, United States 行项目摘要： - SummitPro Laptop 14，数量 5，金额 $5,750.00 - 27 inch QHD External Monitor，数量 5，金额 $1,200.00 - USB-C Docking Station，数量 5，金额 $600.00 - Wireless Keyboard and Mouse Combo，数量 5，金额 $375.00 - Standard On-Site Setup and Configuration，数量 5，金额 $425.00 - 1-Year Standard Support and Warranty Extension，数量 5，金额 $475.00 小计：$8,825.00 税费：$551.56 应付总额：$9,376.56 付款期限：Net 30，June 14, 2024 JSON 摘要： { "document_type": "INVOICE", "invoice_number": "INV-2024-05781", "vendor": "Summit Peak Solutions, LLC", "customer": "Brighton Financial Group", "total_amount_due": 9376.56, "due_date": "June 14, 2024" }

查看提示词和输出

联系人提取

名片 -> 联系信息

完整 OCR 文本： Alex Morgan Senior Marketing Manager +1 (415) 555-0187 alex.morgan@northbridgeconsulting.com www.northbridgeconsulting.com 245 Market Street, Suite 800, San Francisco, CA 94105 NORTHBRIDGE CONSULTING 结构化信息：姓名：Alex Morgan 职位：Senior Marketing Manager 公司：Northbridge Consulting 电话：+1 (415) 555-0187 邮箱：alex.morgan@northbridgeconsulting.com 网站：www.northbridgeconsulting.com 地址：245 Market Street, Suite 800, San Francisco, CA 94105 JSON： { "name": "Alex Morgan", "title": "Senior Marketing Manager", "company": "Northbridge Consulting", "phone": "+1 (415) 555-0187", "email": "alex.morgan@northbridgeconsulting.com" }

查看提示词和输出

菜单 OCR

菜单照片 -> 结构化菜单

菜单分区： COFFEE、TEA、BREAKFAST、DESSERTS 可见菜品示例： COFFEE：Espresso $3.00、Americano $3.50、Cappuccino $4.50、Latte $4.75、Mocha $5.00、Cold Brew $4.50 TEA：English Breakfast $3.25、Green Tea $3.25、Chai Latte $4.50、Herbal Tea $3.50、Matcha Latte $5.00 BREAKFAST：Butter Croissant $3.75、Avocado Toast $7.50、Bagel & Cream Cheese $4.50、Breakfast Sandwich $8.25 DESSERTS：Cheesecake $5.75、Chocolate Cake $5.95、Lemon Tart $5.50、Cookies $2.50 总结：这是一张咖啡馆菜单，包含咖啡、茶、早餐和甜点，价格以美元标注，适合整理成结构化菜单表。

查看提示词和输出

简历解析

简历 -> 结构化 JSON

候选人：Daniel Carter 地点：Chicago, IL 电话：(555) 321-7845 邮箱：daniel.carter@example.com LinkedIn：linkedin.com/in/danielcarter 职业摘要：候选人具备运营和项目管理经验，擅长跨团队协作、流程优化、数据分析和利益相关方沟通。工作经历： - Senior Operations Specialist，Northbridge Solutions，2021 - Present - Project Coordinator，Meridian Consulting Group，2018 - 2021 - Operations Analyst，Lakeview Services，2016 - 2018 教育： Bachelor of Science in Business Administration，University of Illinois Urbana-Champaign，2016 技能： Project Management、Process Improvement、Data Analysis、Excel、PowerPoint、SQL、KPI Reporting、Team Leadership 证书： PMP、Lean Six Sigma Green Belt、CBAP

查看提示词和输出

房地产

房间照片 -> 房源文案

1. 房源标题：明亮现代的海岸风客厅，带壁炉与大面积窗景 2. 简短副标题：自然光充足、布局通透、氛围宁静的开放式生活空间 3. 卖点： - 大窗引入充足自然光。 - 现代壁炉成为空间视觉焦点。 - 中性色和木质元素营造温暖质感。 - 室内绿植和装饰画增加生活气息。 - 客厅与用餐区连接自然，适合日常起居和待客。 4. 描述：这个客厅以明亮采光、柔和色彩和现代线条为主要特点。大窗让室外绿意成为空间背景，壁炉和开放式布局增强了舒适感。整体风格安静、清爽，适合追求自然光和精致生活氛围的买家。 5. 风格：现代海岸风 / 开放式客厅 6. SEO 关键词：明亮客厅、现代海岸风、开放式客厅、壁炉客厅、大窗采光、现代住宅

查看提示词和输出

食物照片

食物照片 -> 菜单文案

1. 菜品名称：经典拉面碗 2. 简短副标题：浓郁汤底 · 叉烧 · 溏心蛋 3. 可见食材：拉面、叉烧片、溏心蛋、葱花、海苔、笋干。 4. 菜品描述：一碗热气腾腾的拉面，搭配浓郁汤底、柔软叉烧和半熟蛋黄。葱花与海苔带来清爽和鲜味层次，是一份适合正餐的经典舒适料理。 5. 建议分类：拉面 / 日式面食 6. 搜索关键词：拉面、叉烧拉面、溏心蛋拉面、日式拉面、热汤面 7. 促销短句：一碗热汤拉面，吃出浓郁与满足。

查看提示词和输出

需要专门面向商品的工作流？

将商品图片转换为可见属性、目录文案和核实清单。

生成商品图片描述

AI 图片描述能做什么？

一次上传，数十种可能。以下是你能实际完成的事。

反向提取 AI 提示词

上传任意照片、插画或作品，获得详细的生成提示词，可直接粘贴到 Midjourney、DALL-E、Stable Diffusion 或 Flux 中复现风格。

提升图片 SEO 排名

搜索引擎看不到图片。添加关键词丰富的描述和结构化 Alt 文本，让 Google 索引你网站上的每张图片，这对图片搜索流量至关重要。

通过无障碍审计

自动生成符合 WCAG、125 字符以内的 Alt 文本。修复全站无障碍审计问题的最快方式之一。

把产品照片变成商品文案

上传产品照片，获得含标题、要点和描述的结构化商品文案，可直接用于 Amazon、Shopify、Etsy 等平台。

从任意图片中提取文字

支持 32 种语言的 OCR，包括手写、倾斜拍摄、收据和密集文档。不只提取文字，还保留布局并解释上下文。

解读图表和数据可视化

将柱状图、流程图、组织架构图和信息图转化为通俗易懂的文字说明，适合报告和文档。

从照片生成社交文案

上传照片，获得带钩子和话题标签的即发文案，适用于 Instagram、X、LinkedIn 或 TikTok，自动匹配品牌调性。

把截图变成代码

上传 UI 截图或线框图，获得 HTML、CSS 或 Draw.io 图表。跳过手动重建步骤，设计直接变成可用代码。

逐场景总结视频

获取视频中每个场景的时间戳分解，包括动作、屏幕文字、转场和语音内容。支持 20 分钟以上的片段。

识别照片中的一切

识别名人、动漫角色、地标、植物、动物、产品和 Logo，视觉知识面比标准模型更广。

数字化文档和发票

从扫描的发票、合同、收据和表单中提取日期、金额、行项目和结构化字段，无需手动录入。

3 步描述图片或视频

上传文件

拖放、粘贴 URL 或选择文件。支持最大 15 MB 的 JPG、PNG、WebP、GIF。

选择输出模式

描述、Alt 文本、OCR、提示词、SEO 文案或视频摘要。

复制、优化或导出

立即在工作流中复用结果，也可以重新生成尝试不同角度。

真实工作流记录

真实工作中如何使用 Describe Image

覆盖无障碍写作、电商内容、OCR 清理、提示词研究、支持和审核任务的实用图片与视频工作流。

Maya Chen

电商商品列表

供应商图片经常没有任何说明。我会先用第一版回答起草标题和几个功能卖点。

Daniel Brooks

无障碍替代文本

我通常先让它详细解读，再要求一版 125 字符以内的结果。第二轮才真正适合用在 alt 文本工作里。

Sofia Martin

社交标题草稿

做图片较多的帖子时，我会先上传图片再写标题。它能用清楚的话说明物体、场景和氛围，所以最终文案不那么像通用模板。

Ethan Walker

截图支持备注

我用它处理杂乱的客户截图。它能读出可见文字、解释屏幕状态，并给我一版回复草稿。我仍然会核实问题，但不用先手动描述每个按钮和错误信息。

Priya Nair

博客图片 SEO

它能帮我写出基于真实可见内容的图片文案，而不是只围绕我脑子里的关键词写。

Caleb Foster

库存照片备注

仓库图片很少干净清晰。我会问哪些标签文字能读到、画面里是什么物体，以及哪些地方太模糊不能信任。

Nora Evans

课程幻灯片摘要

我会上传信息密集的讲义幻灯片，并要求两版：一版短说明用于标题，一版更适合学生做笔记。它不能替代编辑，但当一套课件有五十页时能让我快很多。