韩国本土AI模型竞赛多个入围者被发现“中国代码”:智谱、阿里巴巴和 Deepseek 套壳
韩国本土AI模型竞赛多个入围者被发现“中国代码”:智谱、阿里巴巴和 Deepseek 套壳
去年6月,韩国政府发起了一项竞赛,旨在利用韩国技术开发全新的独立人工智能(AI)模型。在美中两国已然主导AI版图的当下,这样一款本土工具对于确保韩国的技术自主至关重要。
事实证明,这件事说起来容易做起来难。
在这场为期三年的竞赛中,五家入围决赛的公司中有三家被发现至少部分使用了来自外国AI模型的开源代码,其中包括中国的模型。
这些公司和AI专家辩称,摒弃现有AI模型而试图从零开始构建一切是没有什么意义的。但也有人认为,任何对外国工具的使用都会带来潜在的安全风险,也会削弱打造不折不扣的本土AI模型的愿景。
哈佛大学(Harvard University)电子工程学教授Gu-Yeon Wei表示,在进行AI模型开发时,要求每一行代码都完全自行编写是不现实的。他对韩国的这场竞赛很熟悉,但没有直接参与任何一家参赛公司的项目。
Wei说,放弃开源软件,就等于放弃了巨大的既得优势。
世界各国正日益寻求减少对外依赖,以此打磨自身AI实力——这项技术可能会深远影响一国的经济竞争力和国家安全。
该竞赛旨在到2027年评选出两家本土获胜者,其模型性能需达到OpenAI或谷歌等领军企业AI模型的95%或以上。获胜者将有权获得国家资金用于数据和人才招聘,以及使用政府采购的、对AI计算至关重要的芯片。
近日,决赛入围者Upstage引发了争议。据本土竞争对手Sionic AI的首席执行官称,Upstage的AI模型中一部分组件与中国公司智谱(Zhipu AI)的一款开源模型有相似之处。他还声称,Upstage的一些代码中留有智谱的版权标记。
“一个疑似只是对一款中国模型进行了微调的套壳模型竟然被提交给由纳税人资金资助的项目,这令人深感遗憾,”Sionic首席执行官Ko Suk-hyun在领英(LinkedIn)上写道。Sionic也参加了韩国的这场竞赛,但未能进入决赛名单。
作为回应,Upstage举行了一场直播验证会,展示了其开发日志,以证明其模型是利用自有方法从零开始开发和训练的。但用于运行模型的推理代码使用了源自智谱的开源元素,而这些元素在全球范围内被广泛使用。Sionic的首席执行官已经致歉。
此次审查促使人们对其他入围者进行了更细致的审视。Naver的AI模型被指在视觉和音频编码器方面与中国阿里巴巴(Alibaba)和OpenAI的产品有相似之处,这些编码器负责将图像和声音转换成机器可识别的表征格式。
SK电讯(SK Telecom)遭到的批评则是,其用于运行AI模型的推理代码与中国DeepSeek的代码有相似之处。
Naver承认使用了外部编码器,但表示使用标准化技术是一项战略决策。该公司强调,决定模型学习和训练方式的核心引擎完全由公司自主开发。SK电讯也提出了类似论点,强调其模型核心的独立性。
竞赛规则并未明确说明是否可以使用外国公司的开源代码。负责监督该竞赛的韩国科学技术信息通信部自争议发生以来没有发布任何新的指导方针。韩国科学技术信息通信部长官裴庆勋(Bae Kyung-hoon)对这场激烈的辩论表示欢迎。
“当我看到当前搅动我国AI产业的技术辩论时,我实际上看到了韩国AI的光明未来,”裴庆勋本月早些时候在一篇社交媒体帖子中写道。
该部在《华尔街日报》(The Wall Street Journal)询问时不予置评。该部计划按原定时间于本周从竞赛的五家决赛入围者中淘汰一家。
首尔大学AI研究所(Seoul National University’s AI Institute)所长Jae W. Lee表示,AI模型的开发是通过设置和微调内部参数以获得输出来实现的,在那些受到质疑的决赛入围者的模型中,这些核心任务似乎并未依赖外国工具。
“他们是从零开始训练的,”他说。
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。


