Feat/image base64 input by btc69m979y-dotcom · Pull Request #203 · netease-youdao/LobsterAI

btc69m979y-dotcom · 2026-03-02T03:52:27Z

Summary

支持在 cowork 模式中选择图片，以 base64 编码直传给视觉模型
图片附件在对话消息中显示缩略图预览
修复多轮对话中图片附件丢失和预览不显示的问题

Closes #71

对于支持图像输入的模型（supportsImage），在 Cowork 模式中上传图片时，将图片以 base64 image content block 直接放入 messages 发送给模型，利用模型原生视觉能力识别图片内容，而非走原有的文件路径 + ReadFile 工具流程。对于不支持图像的模型，维持现有的文件路径逻辑不变。主要改动： - 新增 CoworkImageAttachment 类型定义 - CoworkPromptInput 识别图片文件（扩展名白名单），读取为 base64 data URL - 新增 dialog:readFileAsDataUrl IPC 接口（读取本地图片，20MB 限制） - 全链路透传 imageAttachments：UI → IPC → CoworkRunner - CoworkRunner 在 local 模式下构造 SDKUserMessage with image blocks，通过 AsyncIterable 形式传给 Claude Agent SDK 的 query() 函数 - 图片附件在 UI 中以蓝色 PhotoIcon 区分显示 - 图片 base64 数据持久化到消息 metadata 中（支持多轮对话上下文） - OpenAI 兼容代理已有 image → image_url 转换，无需额外修改已验证：kimi-k2 模型可正常工作。已知遗留问题（后续更新）： - 聊天消息列表中未显示图片内容预览或文件路径，需补充 UI 展示 - minimax 等部分模型/渠道尚需进一步测试兼容性 - sandbox 模式下图片附件暂回退为文件路径方式 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>

1. 修复 sanitizeCoworkMessageForIpc 截断 imageAttachments base64 数据的问题 - 之前 sanitizeIpcPayload 会将 base64 字符串截断至 4000 字符 - 现在将 imageAttachments 从通用 sanitize 流程中排除，保留原始数据 2. 在 UserMessageItem 中添加图片缩略图预览和点击放大 lightbox 3. 修复 tempSession 中首轮消息也包含 imageAttachments metadata 4. 更新 electron.d.ts 类型定义，补充 imageAttachments 和 readFileAsDataUrl Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>

startSession 的 !skipInitialUserMessage 分支构建用户消息时，仅处理了 skillIds 而忽略了 imageAttachments，导致当 continueSession 因 activeSession 不存在而 fallback 到 startSession 时，图片附件的 metadata 丢失，前端无法渲染图片预览。

在 IPC handler、CoworkRunner、CoworkService、CoworkView、 CoworkPromptInput、UserMessageItem 各环节添加 imageAttachments 相关的 console.log，便于追踪图片数据在进程间传递时是否丢失。

…base64-input Feat/image base64 input

btc69m979y-dotcom and others added 4 commits February 27, 2026 17:43

chore: 添加图片附件流转的调试日志

59c2452

在 IPC handler、CoworkRunner、CoworkService、CoworkView、 CoworkPromptInput、UserMessageItem 各环节添加 imageAttachments 相关的 console.log，便于追踪图片数据在进程间传递时是否丢失。

btc69m979y-dotcom merged commit 42954aa into main Mar 2, 2026

btc69m979y-dotcom mentioned this pull request Mar 2, 2026

无法识别图片，也无法读取word #122

Closed

btc69m979y-dotcom deleted the feat/image-base64-input branch March 2, 2026 08:31

mammut001 pushed a commit to mammut001/LobsterAI that referenced this pull request Mar 11, 2026

Merge pull request netease-youdao#203 from netease-youdao/feat/image-…

dc94a5a

…base64-input Feat/image base64 input

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Feat/image base64 input#203

Feat/image base64 input#203
btc69m979y-dotcom merged 4 commits intomainfrom
feat/image-base64-input

btc69m979y-dotcom commented Mar 2, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

btc69m979y-dotcom commented Mar 2, 2026

Summary

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant