快科技10月17日音讯,最近,EXO践诺室展示了其最新效果:将两台NVIDIA的DGX Spark迷你超算与苹果的M3 Ultra Mac Studio相衔尾,奏凯打造出一个高效的AI协同收罗,终昭着AI性能的大幅提高。 这成绩于EXO践诺室的主要模式EXO,其中枢在于其大致将大型话语模子(LLM)的推理任务智能分拨到不同的硬件修复上。 传统上,推理任务频繁依赖于单一的GPU或加快器,而EXO则大致自动将责任负载散播到用户所领有的各式修复上,不管是桌面电脑、札记本、责任站、职业器、平板电脑致使
快科技10月17日音讯,最近,EXO践诺室展示了其最新效果:将两台NVIDIA的DGX Spark迷你超算与苹果的M3 Ultra Mac Studio相衔尾,奏凯打造出一个高效的AI协同收罗,终昭着AI性能的大幅提高。
这成绩于EXO践诺室的主要模式EXO,其中枢在于其大致将大型话语模子(LLM)的推理任务智能分拨到不同的硬件修复上。
传统上,推理任务频繁依赖于单一的GPU或加快器,而EXO则大致自动将责任负载散播到用户所领有的各式修复上,不管是桌面电脑、札记本、责任站、职业器、平板电脑致使智高东说念主机,王人不错成为这个协同AI收罗的一部分。
在EXO的最新演示中,两台NVIDIA DGX Spark与苹果的Mac Studio被组合在沿路,以充分诈欺了每台机器的独到上风。
DGX Spark领有雄壮的计算智力,而Mac Studio则领有超宽的内存位宽和快速的数据传输智力著称,EXO 1.0版块将这两者交融为一个单一的推理管说念,而况效果畸形地好。
在EXO使用Meta的Llama-3.1 8B模子进行的基准测试中,这种羼杂诞生比单独使用Mac Studio的速率快了2.8倍。
这仍是在使用相对较小的8B模子和8K-token的情况下,要是使用更长的辅导或更大的模子,性能提高可能会愈加权臣。
开yun体育网