欢迎阅读 OSCHINA 编辑部出品的开源日报——您探索和理解开源世界的日常指南。在这里,我们每天从宏观到微观,全方面展现开源技术和文化的动态图景。
01面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」
07 OpenAI 的 AI 搜索也要来了,但我们应该这么多 AI 搜索么
相比口碑之作 Llama3-70B,Eurux-8x22B 发布时间更早,综合性能相当,尤其是拥有更强的推理性能 ——刷新开源大模型推理性能 SOTA,堪称开源大模型中「理科状元」。
相比口碑之作 Llama3-70B,Eurux-8x22B 发布时间更早,综合性能相当,尤其是拥有更强的推理性能 ——刷新开源大模型推理性能 SOTA,堪称开源大模型中「理科状元」。
Arc 浏览器最大的不同就是引入了 “Space” 概念(类似于 “Groups”),用户都能够创建不同的 “Space” 来满足多种场景的浏览需求,每个 Space 下的网址集合可以一次性分享给他人。
58 行代码把 Llama 3 扩展到 100 万上下文,任何微调版都适用
堂堂开源之王 Llama 3,原版上下文窗口居然只有……8k,让到嘴边的一句 “真香” 又咽回去了。
在 32k 起步,100k 寻常的今天,这是故意要给开源社区留做贡献的空间吗?
开源社区当然不会放过这个机会:现在只需 58 行代码,任何 Llama 3 70b 的微调版本都能自动扩展到 1048k(一百万)上下文。
海尔电器把开放平台关了。然后还让第三方智能家居的插件作者把 Github 仓库删掉,作者删了之后不满意。又做了个 haier 的仓库。
聊聊如何借助 Docker ,尝试将一台五年前的手机,构建成一个贴身携带的、本地化的知识库。
Shortcuts 提供自动语音识别(ASR)、文本到语音转换(TTS)和 HTTP 请求功能,这些基本上涵盖了我们本地需要的所有功能。你还可以将一个快捷操作绑定到 iPhone 的动作按钮,这样即使在锁屏状态下也能快速访问。
接下来,作者简单编写了一个 Cloudflare Worker,它从快捷操作接收文本,发送到 llama 3 做处理,然后将函数调用结果返回。
虽然这只是一个基础示例,但其实还可以扩展,包括更复杂的函数调用和数据存储等。
它的响应速度超过所有的 AI 穿戴设备,并且不需要额外的硬件或者支付月费。
此 AI 应用程序使用 Streamlit(一个开源 Python 框架,数据科学家和 AI/ML 工程师只需几行代码即可提供动态数据应用程)构建,步骤如下:
我发现我在我歌学到的技能大部分在新工作中一样好使。其中特别有用的有两条:
要是有件事大多数人都说做不成,不要听大多数人的,该出手时就出手哇,风风火火闯九州哇。
美国最近宣布限制中国使用 RISC-V 架构,紧接着以 “不作恶” 著称的谷歌便决定移除 Android 操作系统对 RISC-V 的支持,封闭了这一潜在的漏洞。RISC-V 架构被广泛认为是中国最有价值的开源指令集内核,众多芯片制造商已经开发出多种基于 RISC-V 的芯片产品,覆盖从家用电器控制到笔记本电脑等多个领域。随着 Android 系统不再支持 RISC-V,这可能会对 RISC-V 的发展造成阻碍。
钛媒体 App 独家获悉,估值超 200 亿的国内 AI 大模型独角兽公司 “智谱 AI” 正在研发对标 OpenAI Sora 的高质量文生视频模型,预计最快年内发布。
“文生视频目前处于一个加快速度进行发展的阶段,预计今年将是文生视频大模型的爆发期。国内公司在文生视频技术方面的客户的真实需求非常多样,从电影拍摄到短视频、游戏制作等。智谱也将利用更高质量的数据和更大的参数,开发高质量的文生视频产品。” 一位智谱 AI 内部人士对钛媒体 App 表示。
一波未平一波又起,不光 APP 被批评套壳安卓,主推的大动作模型 LAM 依赖 OpenAI 接口,现在公司也被扒皮有猫腻 ——
这家曾经主打 NFT 游戏的勇于探索商业模式的公司,去年转型做 AI 终端(即 R1)。并在转型后疑似 “删号跑路”,留下一堆曾为其付费的用户不管。
要知道,Rabbit 前身推出的 GAMA,是一款需要预先付费购买 NFT 的游戏,其中有的 NFT 售价高达 2000 + 美元(折合人民币超 2 万)。
再联想到 Rabbit 同样也需要预先支付费用,于是网友发出灵魂拷问:要是 CEO 又跑了,Rabbit R1 还会有什么价值呢?
上海市经济和信息化委员会主任张英参加 2024 上海民生访谈栏目时表示,AI是上海坚定不移发展的三大先导产业之一,也是培育新质生产力的重中之重。当前人工智能正进入集中爆发期。
去年 11 月,上海发布了推动大模型创新发展 “11 条举措”,从算力、语料、模型、测试等方面,作了全面布局。目前,上海人工智能实验室 “书生”、商汤 “商量” 等 24 款大模型通过国家备案,居全国第二,形成了 “1+4” 的通用大模型格局(1 款开源、2 款商用、2 款在研),体现了在行业内的深化应用。今年通用大模型正在慢慢地收敛,一大批聚焦制造、金融、政务等垂类模型正加快孕育。
GreptimeDB 是 Rust 实现的开源时序数据库,尤其关注可扩展性、分析能力和效率,专为云时代的基础设施而设计。
视觉语言模型可以同时从图像和文本中学习,因此可用于视觉问答、图像描述等多种任务。
本文,我们将带大家一览视觉语言模型领域:作个概述、了解其工作原理、搞清楚怎么样找到真命天 “模”、如何对其进行推理以及怎么样去使用最新版的trl轻松对其进行微调。
由于 ACK 删除了对 RISC-V 的支持,想要立即编译 Android RISC-V 版本的公司和机构,需要创建和维护自己的 Linux 分支,以便于进一步整合 RISC-V 补丁。
RISC-V 作为一种开放标准,尽管得到了国际支持和合作,但在智能手机应用方面尚未实现。谷歌的这一决策可能会对 RISC-V 架构在智能手机领域的应用产生影响。
且许多芯片制造商和处理器设计师已经在 RISC-V 架构的未来发展上进行了投资。例如,高通正在开发用于 Wear OS 的 RISC-V 芯片。谷歌的这一决策可能会对这些芯片制造商产生影响。
此外,RISC-V 架构被视为对 ARM 架构的一种竞争。谷歌的这一决策也有一定可能会影响 RISC-V 在 SSD 控制器市场中的竞争力。
微软首席技术官凯文 - 斯科特(Kevin Scott)、首席执行官萨蒂亚 - 纳德拉(Satya Nadella)和联合发起人比尔 - 盖茨(Bill Gates)之间的一封题为 “Thoughts on OpenAI” 的内部邮件,揭示了在微软披露合作伙伴关系之前的几个月里,围绕投资机会进行的一些高层讨论。
Scott 在 2019 年 6 月 12 日写给 Nadella 和 Gates 的电子邮件中写道:“在机器学习规模方面,我们落后竞争对手多年”。并详细描述了微软工程师是如何花了六个月的时间来复制谷歌的 BERT 语言模型并对其进行训练的,“因为我们的基础设施无法胜任这项任务”。
微软对 OpenAI 的投资反映了其对自身在AI领域相对落后的认识,以及对技术领先的追求。这一投资决策可能与微软对谷歌在人工智能技术上的领先感到的焦虑有关,突显了市场主导地位的争夺。
微软对 OpenAI 的投资,以及谷歌在AI领域的领头羊,突显了人工智能技术在当今科技行业中的战略重要性。大型科技公司之间的合作和竞争,以及它们如何平衡这些关系,是这个事件背后的一个重要议题。
此外,美国联邦贸易委员会对生成式 AI 市场中的主要参与者做出详细的调查,也显示了监督管理的机构对市场之间的竞争和投资合作的关注。这一事件还映射出人工智能技术对未来社会和商业环境可能产生的深远影响。
央视《今日说法》栏目近期报道了一名 90 后程序员通过开发非法视频搬运软件在不到一年的时间里获利超 700 万,最终获刑的案例。
国内某知名短视频平台报警称,有人在网络上售卖一款非法软件,使用软件的人可以绕过他们平台的审核机制,直接窃取他人的作品进行发布。浙江台州警方调查发现,在这背后是一条违法犯罪的产业链条,犯罪团伙的上游开发制作非法软件,通过更改短视频平台的代码,逃避平台监管。
国内某知名短视频平台报警称,有人在网络上售卖一款非法软件,使用软件的人可以绕过他们平台的审核机制,直接窃取他人的作品进行发布。浙江台州警方调查发现,在这背后是一条违法犯罪的产业链条,犯罪团伙的上游开发制作非法软件,通过更改短视频平台的代码,逃避平台监管。
此案例强调了保护知识产权的重要性,尤其是在数字化和网络化日益普及的今天。虽然创业是鼓励的,但选择合法合规的项目至关重要;强调了个人在网络安全中的道德责任,即使在看似无害的行为背后也可能隐藏着严重的法律风险。
另一方面,随技术的发展,法律可能跟不上技术应用的速度,导致法律监管的缺失。同时也反映出网络监管和平台安全的重要性,平台需要加强技术措施以防止此类非法行为的发生。
虽然 AI 搜索技术很强大和有价值,但从使用者真实的体验、习惯和企业资源配置的方面出发,将其作为增强现有产品的一个特性,而非开发为独立的搜索产品,可能是更为合理的方向。这样不仅能更好地使用户得到满足需求,对企业来说也是更好地选择。
看起来,AI 搜索离生成式AI时代的 Killer App 距离尚远,它甚至有可能并不是一个理想的生意。我们并不是特别需要那么多的 AI 搜索产品,但我们应该更多的 AI 搜索 Feature。
虽然 AI 初创公司当前仍然处于入不敷出、苦苦探索盈利模式的阶段,但 AI 的热潮已经让提供算力和数据的 AI 基础设施供应商赚得盆满钵满。观察微软 AI 投资的两条主线,这个领先者的野心也昭然若揭:一方面通过外部投资或直接 “兼并” AI 初创公司,保持自身在生成式 AI 技术的优势;另一方面,通过大力布局 AI 基础设施,发力云计算市场,打造更强劲的业绩增长曲线。
AI 是下一个时代的技术浪潮,甚至有可能是人类历史上最大的科技革命。从 AlphaGo 的突破到硅谷的最新进展,AI 技术的加快速度进行发展正不断推动社会进步。尽管存在成本高昂和潜在的政治影响等挑战,AI 在无人驾驶、语言模型等领域的应用已经展现出巨大的变革潜力。
观点 4:项目中接触了几位外企的一线技术人员,老外的一位项目带头人 60 好几了,依然在 Coding。这就是差距。
观点 8:年轻人有冲劲,让他们先冲,搞出问题,我们这些老灯再出来擦,年轻人得到了锻炼机会,老灯们保住了饭碗,一举两得,多好
观点 9:哈,出生率低的环境中,又想要更年轻的劳动力,本身就是冲突的。再者工作需要加班才能完成的,要么是能力不行,要么是公司不行
观点 4:项目中接触了几位外企的一线技术人员,老外的一位项目带头人 60 好几了,依然在 Coding。这就是差距。
观点 8:年轻人有冲劲,让他们先冲,搞出问题,我们这些老灯再出来擦,年轻人得到了锻炼机会,老灯们保住了饭碗,一举两得,多好
观点 9:哈,出生率低的环境中,又想要更年轻的劳动力,本身就是冲突的。再者工作需要加班才能完成的,要么是能力不行,要么是公司不行
观点 1:微软前工程师称 Windows 11 性能差得笑死人,难怪市场占有率持续下降 所以他现在是微软前工程师了。
观点 8:win10 也好,11 也罢。都有一个让我不理解的地方,为啥开机到进桌面的时间越用越长?按了开机键后,硬盘灯几乎一直常亮,感觉电脑费了吃奶的劲,好不容易才进了桌面。就算进了桌面,硬盘还要疯狂工作一段时间才歇下来。至于在开机这样的一个过程要做这么多事吗?我用的一般 ssd。
观点 10:现在新机一水预装 win11, 不理解 win10 的份额是怎么增加的?难道有大批的系统在降级么?感觉不过是统计的问题。
观点 1:微软前工程师称 Windows 11 性能差得笑死人,难怪市场占有率持续下降 所以他现在是微软前工程师了。
观点 8:win10 也好,11 也罢。都有一个让我不理解的地方,为啥开机到进桌面的时间越用越长?按了开机键后,硬盘灯几乎一直常亮,感觉电脑费了吃奶的劲,好不容易才进了桌面。就算进了桌面,硬盘还要疯狂工作一段时间才歇下来。至于在开机这样的一个过程要做这么多事吗?我用的一般 ssd。
观点 10:现在新机一水预装 win11, 不理解 win10 的份额是怎么增加的?难道有大批的系统在降级么?感觉不过是统计的问题。
观点 1:鲁班七号 没有技术上的含金量但是解救了很多人 1.0 替换待发布的缓存视频 最后更新诸神黄昏版本是替换视频模板 当时是直播切片的时代 一台手机一天几万流水(矩阵利润自己想吧) 只有懂得人才知道鲁班七号产生的价值 我当时卖出去的卡密让很多人翻了身喘了口气
观点 3:厉害的是他的销售,一年卖 20 万份。有这销售能力干啥不好。
观点 4:他窃取的视频是不知道多少原创作者的心血,没有所谓收入,不过是抢夺罢了。
观点 5:这都能赚 700 多万?这技术我真心不觉得难,佩服的是这哥们的销售技术
观点 8:正确的操作方式是,入职一个企业,月薪 5 万,工作十分轻松,老板喜欢看短视频,他就把自己开发的下载软件 “免费” 分享给老板。工作半年后公司破产了,但 30 万工资已经结清。你说他要不要承担责任?
观点 9:替换已审核通过视频,相当于数据库数据被篡改,说明视频平台暴露了相关接口,视频平台漏洞也不小。
观点 1:鲁班七号 没有技术上的含金量但是解救了很多人 1.0 替换待发布的缓存视频 最后更新诸神黄昏版本是替换视频模板 当时是直播切片的时代 一台手机一天几万流水(矩阵利润自己想吧) 只有懂得人才知道鲁班七号产生的价值 我当时卖出去的卡密让很多人翻了身喘了口气
观点 3:厉害的是他的销售,一年卖 20 万份。有这销售能力干啥不好。
观点 4:他窃取的视频是不知道多少原创作者的心血,没有所谓收入,不过是抢夺罢了。
观点 5:这都能赚 700 多万?这技术我真心不觉得难,佩服的是这哥们的销售技术
观点 8:正确的操作方式是,入职一个企业,月薪 5 万,工作十分轻松,老板喜欢看短视频,他就把自己开发的下载软件 “免费” 分享给老板。工作半年后公司破产了,但 30 万工资已经结清。你说他要不要承担责任?
观点 9:替换已审核通过视频,相当于数据库数据被篡改,说明视频平台暴露了相关接口,视频平台漏洞也不小。