开源日报 | 李厂长一句话得罪整个IT行业;全球首个AI原生操作系统;开源vs.闭源LLM表现;揭底大模型训练成本

欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2024.4.16

今日要点

华为自用的时序数据库开源啦,来看看水平怎么样?

2022 年底,又一重磅产品加入了开源时序数据库这一赛道,并在短短一年内在 60 余家企业测试和生产落地,吸引了 70 + 来自国内外重点高校和企业的贡献者 ——openGemini,华为开源的分布式时序数据库,主要聚焦于海量时序数据的存储和分析,通过技术创新,简化业务系统架构,降低海量时序数据的存储成本,提升时序数据的存储和分析效率。

百度宣布全球首个 AI 原生操作系统 DuerOS X

4 月 16 日,Create 2024 百度 AI 开发者大会在深圳举办。小度科技在会上宣布了全球首个AI 原生操作系统 DuerOS X。

据介绍,该系统基于文心大模型进行了全面升级,在多模态感知和拟人化呈现方面有了重要突破。通过 DuerOS X,小度的人机交互体验将实现质的飞跃,为用户提供更加自然、智能的交互方式。

文心大模型是百度在人工智能领域的重要成果,它为 DuerOS X 提供了强大的技术支持。搭载文心大模型的 DuerOS X 不仅更加有用,也更具灵魂,能够为用户提供更多的情绪价值和陪伴价值。

苹果 App Store 下架抄袭开源项目的 Game Boy 模拟器 iGBA

苹果昨天从 App Store 下架了近期刚刚上架的 GameBoy 模拟器 iGBA,原因是该应用违反了 App 审核指南的垃圾内容(第 4.3 节)和版权(第 5.2 节)相关规定。

iGBA 是一款 Game Boy 模拟器,用户可使用它免费下载 ROM 来玩 Game Boy 游戏。iGBA 在苹果 App Store 上架后迅速获得了用户的关注,并跻身热门应用行列。然而,这款应用很快就被苹果公司下架,原因是它违反了苹果的应用审核指南中的垃圾信息和版权相关规定。

今日观察

今日推荐

开源项目

https://gitee.com/sxwdmjy/dy-java

DyJava 是一款功能强大的抖音 Java 开发工具包,支持多种抖音开发功能模块的后端开发,包括但不限于移动 / 网站应用、开放平台、抖店和小程序等。DyJava 致力于简化开发流程,提高开发效率,让开发者能够更专注于创新和业务逻辑的实现。

每日一博

随着摩尔定律增长的逐渐减缓,系统规模的水平扩展已经成为提升系统性能的关键策略。然而,这种扩展依赖于分布式系统架构的支持,而分布式编程的固有复杂性给构建高效、可靠及弹性的系统带来了严峻挑战。因此,简化分布式编程依旧是分布式编程框架追求的核心目标。

事件点评

苹果 App Store 下架抄袭开源项目的 Game Boy 模拟器 iGBA

苹果昨天从 App Store 下架了近期刚刚上架的 GameBoy 模拟器 iGBA,原因是该应用违反了 App 审核指南的垃圾内容(第 4.3 节)和版权(第 5.2 节)相关规定。

iGBA 被指抄袭了开发者 Riley Testut 的开源作品 GBA4iOS。GBA4iOS 一直以来都只能在苹果 App Store 之外获取,而 iGBA 在上架后,用户发现它与 GBA4iOS 存在高度相似性,并且加入了额外的广告。

点评

这个事件可能会引发一系列的讨论和反思。首先,这是对开源社区的一种不尊重,抄袭他人的开源作品并试图通过添加广告来盈利,这种行为是不被接受的。其次,这也反映出App Store的审核机制可能存在一些问题,需要进一步加强以防止类似的情况发生。

总的来说,这个事件提醒我们,尊重开源社区、尊重他人的创新成果是每一个开发者和公司应该遵守的原则。同时,也提醒我们,作为用户也需要更加关注我们使用的应用的来源,避免使用可能侵犯他人权益的应用。

李彦宏:自然语言将成为新的通用编程语言、开源模型会越来越落后

百度创始人、董事长兼首席执行官李彦宏今天在 Create 2024 百度 AI 开发者大会上发表了题为《人人都是开发者》的演讲。他认为,大模型和生成式 AI 将彻底改变开发者这个群体。

李彦宏提到,有了基础模型文心 4.0 之后,百度可以根据需要,兼顾效果、相应速度,推理成本等各种考虑,剪裁出适合各种场景的更小尺寸模型,并且支持精调和 post pretrain(一种预训练的模型训练方法)。

这样通过降维剪裁出来的模型,比直接用开源模型调出来的模型,同等尺寸下,效果明显更好;同等效果下,成本明显更低。

基于这种对比效果,李彦宏放话称,“开源模型会越来越落后”。

点评

首先,李彦宏认为大模型和生成式AI将彻底改变开发者这个群体。这是一个有趣的观点,因为它预示着AI和机器学习将在未来的软件开发中扮演更重要的角色。这可能会导致开发者需要掌握新的技能和工具,以便有效地利用这些大模型和生成式AI。

其次,他提出自然语言将成为新的通用编程语言。这是一个大胆的预测,可能会降低编程的门槛,使更多的人能够参与到软件开发中来。他对于开源模型会越来越落后的预测则可能引发一些争议,因为开源一直被视为推动技术进步的重要力量。然而,如果百度等公司能够开发出性能更优、成本更低的模型,那么开源模型确实可能会面临挑战。

总的来说,这些观点和预测都反映了AI和机器学习在未来软件开发中的重要性,以及开发者可能需要适应的新的开发模式和工具。然而,这些预测的准确性还有待时间的检验。

《人工智能示范法 2.0(专家建议稿)》:重视 AI 开源发展

《人工智能法(示范法)》2.0 在此前版本的基础上不断更新,将基于负面清单实施的人工智能许可管理制度与负面清单外人工智能活动的备案制度明确区分,避免过重合规负担影响人工智能产业的经营预期;重视人工智能开源发展,提出促进开源社区建设、制定专门合规指引、明确责任减免规则等支持措施;构建知识产权创新规则,在研发环节对训练数据、个人信息的使用作出专门安排,并针对人工智能生成物的成果保护与侵权认定进行规定。

点评

这份法案重视人工智能开源发展,提出了促进开源社区建设、制定专门合规指引、明确责任减免规则等支持措施。这是一个积极的信号,因为它表明政策制定者认识到了开源在推动人工智能发展中的重要性,并愿意采取措施支持开源社区的建设。

还对开源人工智能的法律责任进行了减免。可能会鼓励更多的个人和组织参与到开源人工智能的研发中来,推动人工智能的创新和发展。

此外,这份法案构建了知识产权创新规则,在研发环节对训练数据、个人信息的使用作出了专门安排,并针对人工智能生成物的成果保护与侵权认定进行了规定。可能会为人工智能的研发和应用提供更明确的法律指引,降低法律风险。

开源之声

媒体观点

英伟达在AI芯片领域的霸权为市场带来的影响已足够深远。在这样的背景之下英特尔和AMD 能否扛起“挑战英伟达”的大旗?又该如何定位这两家巨头AI芯片产品的市场角色?

-第一财经网

在消费者对ChatGPT等消费级AI应用进行尝鲜和玩票之后,企业也迎来了AI发展的转折点。相比2023年企业纷纷训练自己的大模型,2024年企业对大模型的关注转向推理,以实现差异化和变现。一方面,企业部署大模型对计算架构带来了新的挑战;另一方面,企业对推理的重视,也使其对算力架构的选择走向多元。

-中国电子报

-CCF计算机安全专委会

用户观点

  • 观点 1:这么看不起开源吗。
  • 观点 2:先把搜索弄好再说
  • 观点 3:前提是要能看懂代码
  • 观点 4:百度总是起个大早赶个晚集。又要战略失误了
    • 观点 5:说到底还是实力不足,除了搜索想不起百度搞定了哪件事?
  • 观点 1:are you ok?
  • 观点 2:理解万岁
  • 观点 3:老坛酸菜版本没有这个广告,在等几天估计就出win11第一个老坛酸菜版本了。,
  • 观点:大厂入局是好事

程序员梗图

—END—