[240629] 阿里云揭秘其数据中心设计和自研网络,用于大语言模型训练 | Jina AI 发布最新的神经网络重排序模型

目录

    • 阿里云揭秘其数据中心设计和自研网络,用于大语言模型训练
    • Jina AI 发布最新的神经网络重排序模型

阿里云揭秘其数据中心设计和自研网络,用于大语言模型训练

阿里云近日公布了其专为大型语言模型 (LLM) 训练流量而设计的基于以太网的网络设计,该网络已投入生产八个月。

技术成果:

  • 阿里云每个数据中心配备 15,000 个 GPU,每个主机包含 8 个 GPU 和 9 个网卡,以实现高带宽和避免单点故 障。
  • 阿里云选择以太网是为了避免供应商锁定,并利用“整个以太网联盟的力量实现更快的发展”。
  • 阿里云自研网络名为“高性能网络”(HPN),旨在解决传统路由方法在 LLM 训练中遇到的问题,例如哈希极化。
  • 阿里云偏爱单芯片交换机,因为它们比多芯片交换机更稳定。
  • 阿里云为其交换机创建了定制的均热板散热器,以解决过热问题。
  • 阿里云的数据中心设计为每个建筑容纳一个“Pod”,每个 Pod 包含 15,000 个 GPU。
  • 阿里云已经在设计下一代网络架构,以支持更高容量的单芯片交换机和更大的 LLM 训练集群。

行业影响:

  • 阿里云对以太网的偏好支持了 AMD、Broadcom、Cisco 等公司提出的反对 Nvidia 网络业务垄断的论点。
  • 阿里云的 HPN 设计和数据中心架构展示了其对 LLM 训练基础设施的重大投入。
  • 阿里云对单芯片交换机和定制散热解决方案的采用突出了其对性能、稳定性和成本效益的关注。

阿里云为支持 LLM 训练而做出的技术选择和设计决策,展示了其在人工智能 基础设施领域的雄心和实力。

来源:

https://www.theregister.com/2024/06/27/alibaba_network_datacenter_designs_revealed/

Jina AI 发布最新的神经网络重排序模型

Jina AI 发布了最新的神经网络重排序模型 Jina Reranker v2,该模型在速度、多语言支持和功能上都有显著提 升,尤其适用于检索增强生成(RAG)场景。

Jina Reranker v2 的主要优势:

  • 多语言支持: 支持超过 100 种语言的检索,超越了 bge-reranker-v2-m3 的性能。
  • 代理能力: 具备最先进的函数调用和文本到 SQL 转换能力,适用于代理 RAG 场景。
  • 代码检索: 在代码检索任务中表现出色。
  • 超快速度: 吞吐量比 bge-reranker-v2-m3 高 15 倍,比 jina-reranker-v1-base-en 高 6 倍。

Jina Reranker v2 的特性:

  • 创新需求:弥补嵌入模型在检索精度上的不足。
  • 多语言支持:在 MKQA、BEIR 和 AirBench 等基准测试中表现优异。
  • 应用场景:在结构化数据查询、函数调用和代码检索方面的应用。
  • 推理速度:模型尺寸更小、采用了 Flash Attention 2 技术。
  • 训练过程:分四个阶段进行,包括使用英语数据预训练、添加跨语言数据、微调等。

Jina Reranker v2 的应用方式:

  • 通过 Jina Reranker API:提供简单易用的接口,方便快速集成。
  • 通过 RAG/LLM 框架:与 Haystack、LlamaIndex 和 Langchain 等框架集成。
  • 通过 HuggingFace:提供预训练模型,方便研究和评估。
  • 通过私有云部署:即将在 AWS 和 Azure 平台上线。

Jina Reranker v2 是一个功能强大、性能卓越的重排序模型,可以显著提升 RAG 系统的精度和效率,适用于各种多语言、多模态的检索和生成任务。

来源:

https://jina.ai/news/jina-reranker-v2-for-agentic-rag-ultra-fast-multilingual-function-calling-and-code-search

更多内容请查阅 : blog-240629


关注微信官方公众号 : oh my x

获取开源软件和 x-cmd 最新用法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/756981.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

火了10年的电脑监控软件有哪些?盘点8款热门的电脑监控软件

电脑监控软件领域经历了多年的发展,一些软件因为其稳定的功能、良好的用户体验和不断更新的技术支持,得以在市场上保持长期的热度和用户基础。以下是几款在过去十年里广受好评且持续流行的内网监控软件: 1.安企神:由河北安企神网络…

c++ 子类继承父类

这个是子类继承父类 是否重写从父类那里继承来的函数 这个例子的路径 E盘 demo文件夹 fatherChildfunc

【C++ | 委托构造函数】委托构造函数 详解 及 例子源码

😁博客主页😁:🚀https://blog.csdn.net/wkd_007🚀 🤑博客内容🤑:🍭嵌入式开发、Linux、C语言、C、数据结构、音视频🍭 🤣本文内容🤣&a…

周边美食小程序系统的设计

管理员账户功能包括:系统首页,个人中心,用户管理,美食店铺管理,菜品分类管理,标签管理,菜品信息管理,系统管理 微信端账号功能包括:系统首页,美食店铺&#…

Python 面试【★★★】

欢迎莅临我的博客 💝💝💝,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:「stormsha的主页」…

springboot实习管理系统的设计与实现 LW +PPT+源码+讲解

第三章系统分析与设计 3.1 可行性分析 一个完整的系统,可行性分析是必须要有的,因为他关系到系统生存问题,对开发的意义进行分析,能否通过本系统来补充线下实习管理模式中的缺陷,去解决其中的不足等,通过对…

Java基础(五)——ArrayList

个人简介 👀个人主页: 前端杂货铺 ⚡开源项目: rich-vue3 (基于 Vue3 TS Pinia Element Plus Spring全家桶 MySQL) 🙋‍♂️学习方向: 主攻前端方向,正逐渐往全干发展 &#x1…

蓝卓出席“2024C?O大会”,探讨智能工厂建设新路径

6月29日,“2024C?O大会”在金华成功举办。此次大会由浙江省企业信息化促进会主办,与以往CIO峰会不同,“C?O”代表了企业数字化中的核心决策者群体,包括传统的CIO、CEO、CDO等。 本次大会围绕C?O、AIGC与制造业、数据价值、未来…

[NSSCTF]-Reverse:[SWPUCTF 2021 新生赛]easyapp(安卓逆向,异或)

无壳 把后缀名改为zip,找到apk 查看jadx 这里调用了MainActivity的lambda$onCreate$0$MainActivity,然后又调用了Encoder进行异或。 exp: result棿棢棢棲棥棷棊棐棁棚棨棨棵棢棌 key987654321 flag for i in range(len(result)):flagchr(…

算法:链表题目练习

目录 链表的技巧和操作总结 常用技巧: 链表中的常用操作 题目一:反转一个单链表 题目二:链表的中间结点 题目三:返回倒数第k个结点 题目四:合并两个有序链表 题目五:移除链表元素 题目六&#xff…

Flutter TIM 项目实现

目录 1. 服务端API 1.1 生成签名 1.1.1 步骤 第一步:获取签名算法 第二步:查看函数输入输出 第三步:nodejs 实现功能 1.1.2 验证签名 小结 1.2 Rest API 调用 1.2.1 签名介绍 1.2.2 腾讯接口 生成管理员 administrator 签名 包装一个 post 请求函数 查询账号 …

ATL新能源科技薪资待遇及Verify测评语言理解数字推理题型简介

一、走进ATL新能源科技 ATL新能源公司,即东莞新能源科技有限公司,是全球领先的可充式锂离子电池研发、生产和营销企业。成立于2004年,总部位于香港,产品广泛应用于消费电子产品和电动汽车领域。ATL以其技术创新和与苹果等大客户的…

websocket基础使用学习

websocket基础使用学习 一、websocket是什么?二、使用步骤1.websocket服务的安装与启动安装服务连接与发消息 总结 一、websocket是什么? 以前,很多网站为了实现推送技术,所用的技术都是Ajax 轮询。轮询是在特定的的时间间隔&…

RocketMQ源码学习笔记:Broker接受消息和发送消息

这是本人学习的总结,主要学习资料如下 马士兵教育rocketMq官方文档 目录 1、Overview2、技术亮点2.1、消息写入时的自旋锁和可重入锁2.2、堆外内存机制2.2.1、Overview2.2.2、源码2.2.2.1、开启堆外内存的条件2.2.2.2、堆外内存的初始化2.2.2.3、写消息到堆外内存2…

医院消防设施设备管理系统

医院为人员密集场所,且多为各类病患及其陪护人员,一旦发生火灾,人员疏散逃生困难,容易造成较严重的生命与财产损失。为规范医院的消防设施设备管理,通过凡尔码系统对医院消防设施设备进行信息化管理,提高医…

动手学深度学习(Pytorch版)代码实践 -卷积神经网络-21多输入多输出通道

21多输入多输出通道 import torch from d2l import torch as d2ldef corr2d(X, K):"""计算二维互相关运算"""h, w K.shapeY torch.zeros((X.shape[0] - h 1, X.shape[1] - w 1))for i in range(Y.shape[0]):for j in range(Y.shape[1]):Y[i,…

大创项目推荐 题目:基于机器视觉opencv的手势检测 手势识别 算法 - 深度学习 卷积神经网络 opencv python

文章目录 1 简介2 传统机器视觉的手势检测2.1 轮廓检测法2.2 算法结果2.3 整体代码实现2.3.1 算法流程 3 深度学习方法做手势识别3.1 经典的卷积神经网络3.2 YOLO系列3.3 SSD3.4 实现步骤3.4.1 数据集3.4.2 图像预处理3.4.3 构建卷积神经网络结构3.4.4 实验训练过程及结果 3.5 …

HarmonyOS开发:应用完整性校验

简介 为了确保应用的完整性和来源可靠,OpenHarmony需要对应用进行签名和验签。 应用开发阶段: 开发者完成开发并生成安装包后,需要开发者对安装包进行签名,以证明安装包发布到设备的过程中没有被篡改。OpenHarmony的应用完整性校…

【Docker0】网络更改

目录 1. 停止docker服务 2. 关闭docker默认桥接网络接口 3. 从系统删除docker0接口 4. 创建一个名为bridge0的新接口 5. 添加ip地址和子网掩码 6. 启用bridge0接口 7. (如果没起来就执行该句) 8. 查看ip 1. 停止docker服务 sudo service docker…

SpringBoot: Eureka入门

1. IP列表 公司发展到一定的规模之后,应用拆分是无可避免的。假设我们有2个服务(服务A、服务B),如果服务A要调用服务B,我们能怎么做呢?最简单的方法是让服务A配置服务B的所有节点的IP,在服务A内部做负载均衡调用服务B…