``` Qwen3-VL：更清晰的视觉，更深入的思考，更广泛的行动 ```

``` Qwen3-VL：更清晰的视觉，更深入的思考，更广泛的行动 ```
Qwen3-VL

原始链接: https://qwen.ai/blog?id=99f0335c4ad9ff6153e517418d48535ab6d8afef&from=research.latest-advancements-list

Please provide the content you want me to translate. I need the text to be able to translate it to Chinese. Just paste it here, and I will give you the Chinese translation.

## Qwen3-VL：新的开源多模态领先者 Qwen.ai 的 Qwen3-VL 模型系列因其在多模态任务中的强大性能而备受关注——处理图像和文本。用户报告称，它在以前的开源模型，甚至一些专有模型难以完成的任务中表现出色，例如从低质量图像（例如发票）中提取数据。这些模型可在 Hugging Face 上获得，建议初学者使用 LM Studio。讨论强调了 Qwen 生成边界框以改进 OCR 的能力，甚至能够对复杂的提示提供出乎意料的有用和详细的回复（例如，在 15 世纪佛罗伦萨建造充电器！）。虽然一些人批评 Qwen 不同模型的命名约定，并指出其局限性，例如未能通过“额外肢体”测试，但此次发布被视为开源人工智能领域的重要一步，可能与 OpenAI 的 GPT-4 等闭源模型相匹敌。许多人认为中国正在战略性地投资人工智能，优先考虑优化和可访问性，并可能扰乱当前的市场格局。

``` Qwen3-VL：更清晰的视觉，更深入的思考，更广泛的行动 ``` Qwen3-VL

``` Qwen3-VL：更清晰的视觉，更深入的思考，更广泛的行动 ```
Qwen3-VL