Жим Келлерийн удирдсан чип компани болох Tenstorrent нь хиймэл оюун ухааны ажлын ачаалалд зориулсан дараагийн үеийн Wormhole процессороо худалдаанд гаргалаа. Уг процессор нь боломжийн үнээр сайн гүйцэтгэлтэй байх төлөвтэй байна.Тус компани одоогоор нэг эсвэл хоёр Wormhole процессор багтаах боломжтой хоёр нэмэлт PCIe карт, мөн програм хангамж хөгжүүлэгчдэд зориулсан TT-LoudBox болон TT-QuietBox ажлын станцуудыг санал болгож байна. Өнөөдрийн бүх зарлалууд нь арилжааны ажлын ачаалалд Wormhole самбар ашигладаг хүмүүст бус харин хөгжүүлэгчдэд чиглэгдсэн болно.
“Манай бүтээгдэхүүнүүд хөгжүүлэгчдийн гарт илүү ихийг хүргэх нь үргэлж таатай байдаг. Манай Wormhole™ картуудыг ашиглан хөгжүүлэлтийн системүүдийг гаргах нь хөгжүүлэгчдэд олон чиптэй хиймэл оюун ухааны програм хангамжийг өргөжүүлж, хөгжүүлэхэд тусалдаг” гэж Tenstorrent-ийн гүйцэтгэх захирал Жим Келлер хэлэв.Энэхүү нээлтээс гадна бид хоёр дахь үеийн бүтээгдэхүүн болох Blackhole-ийн соронзон хальсыг салгаж, цахилгаанжуулах тал дээр гаргаж буй ахиц дэвшлийг харахдаа баяртай байна.”
Wormhole процессор бүр нь 72 Tensix цөмтэй (үүнээс тав нь янз бүрийн өгөгдлийн форматтай RISC-V цөмийг дэмждэг) болон 108 MB SRAM-тай бөгөөд 1 GHz давтамжтайгаар 262 FP8 TFLOPS хурдтайгаар 160Вт дулааны дизайны хүчин чадалтай. Нэг чиптэй Wormhole n150 карт нь 12 GB GDDR6 видео санах ойтой бөгөөд 288 GB/s зурвасын өргөнтэй.
Wormhole процессорууд нь ажлын ачааллын олон янзын хэрэгцээг хангах уян хатан өргөтгөх боломжийг олгодог. Дөрвөн Wormhole n300 карттай стандарт ажлын станцын тохиргоонд процессоруудыг програм хангамжид нэгдсэн, өргөн Tensix цөмт сүлжээ хэлбэрээр гарч ирдэг нэг нэгж болгон нэгтгэж болно. Энэхүү тохиргоо нь хурдасгуур нь ижил ажлын ачааллыг зохицуулах, дөрвөн хөгжүүлэгчийн хооронд хуваах эсвэл найман өөр хиймэл оюун ухааны загварыг нэгэн зэрэг ажиллуулах боломжийг олгодог. Энэхүү өргөтгөх чадварын гол онцлог нь виртуалчлал шаардлагагүйгээр орон нутагт ажиллах боломжтой юм. Өгөгдлийн төвийн орчинд Wormhole процессорууд нь машин дотор өргөтгөл хийхэд PCIe, гадаад өргөтгөл хийхэд Ethernet ашиглах болно.
Гүйцэтгэлийн хувьд Tenstorrent-ийн нэг чиптэй Wormhole n150 карт (72 Tensix цөмт, 1 GHz давтамж, 108 MB SRAM, 12 GB GDDR6, 288 GB/s зурвасын өргөн) нь 160Вт-д 262 FP8 TFLOPS гүйцэтгэсэн бол хос чиптэй Wormhole n300 карт (128 Tensix цөмт, 1 GHz давтамж, 192 MB SRAM, 24 GB GDDR6, 576 GB/s зурвасын өргөн) нь 300Вт-д 466 хүртэлх FP8 TFLOPS дамжуулдаг.
466 FP8 TFLOPS-ын 300Вт-ыг авч үзвэл бид үүнийг хиймэл оюун ухааны зах зээлийн тэргүүлэгч Nvidia-ийн энэхүү дулааны дизайны хүчээр санал болгож буй зүйлтэй харьцуулах болно. Nvidia-ийн A100 нь FP8-г дэмждэггүй боловч INT8-г дэмждэг бөгөөд оргил гүйцэтгэл нь 624 TOPS (ховор үед 1,248 TOPS) байдаг. Харьцуулбал, Nvidia-ийн H100 нь FP8-г дэмждэг бөгөөд 300Вт-д 1,670 TFLOPS (ховор үед 3,341 TFLOPS)-ын оргил гүйцэтгэлд хүрдэг бөгөөд энэ нь Tenstorrent-ийн Wormhole n300-аас мэдэгдэхүйц ялгаатай юм.
Гэсэн хэдий ч нэг томоохон асуудал бий. Tenstorrent-ийн Wormhole n150 нь 999 долларын үнэтэй байдаг бол n300 нь 1,399 долларын үнэтэй байдаг. Харьцуулбал, нэг Nvidia H100 график карт нь тоо хэмжээнээс хамааран 30,000 долларын үнэтэй байдаг. Мэдээжийн хэрэг, дөрөв эсвэл найман Wormhole процессор нь нэг H300-ийн гүйцэтгэлийг үнэхээр хангаж чадах эсэхийг бид мэдэхгүй ч тэдгээрийн TDP нь тус тус 600W ба 1200W юм.
Картуудаас гадна Tenstorrent нь хөгжүүлэгчдэд зориулж урьдчилан бэлтгэсэн ажлын станцуудыг санал болгодог бөгөөд үүнд идэвхтэй хөргөлттэй, илүү хямд үнэтэй Xeon дээр суурилсан TT-LoudBox-д 4 n300 карт, мөн EPYC дээр суурилсан Xiaolong (шингэн хөргөлтийн функцтэй) дэвшилтэт TT-QuietBox багтдаг.
Нийтэлсэн цаг: 2024 оны 7-р сарын 29
