AMD Dukung Frontier AI Training untuk Zyphra

  • Zyphra ZAYA1 menjadi model Mixture-of-Experts berskala besar pertama yang sepenuhnya menggunakan GPU AMD Instinct™ MI300X, jaringan AMD Pensando™, dan perangkat lunak terbuka ROCm.
  • ZAYA1-base mengungguli Llama-3-8B dan OLMoE di berbagai tolok ukur, serta menyaingi kinerja Qwen3-4B dan Gemma3-12B.
  • Kapasitas memori AMD Instinct MI300X membantu Zyphra menyederhanakan kemampuan pelatihan, sekaligus mencapai kecepatan penyimpanan model 10x lebih cepat.
doc. Zyphra

SANTA CLARA, California, 25 November 2025AMD (NASDAQ: AMD) mengumumkan bahwa Zyphra telah mencapai tonggak penting dalam pelatihan model AI berskala besar dengan pengembangan ZAYA1, model fondasi Mixture-of-Experts (MoE) pertama yang dilatih menggunakan platform GPU dan jaringan AMD. Dengan memanfaatkan GPU AMD Instinct™ MI300X, jaringan AMD Pensando™, serta open software AMD ROCm™, pencapaian ini dijelaskan dalam laporan teknis Zyphra yang diterbitkan hari ini.

Hasil Zyphra menunjukkan bahwa model ini memberikan kinerja kompetitif atau lebih unggul dibandingkan model terbuka terkemuka dalam tolok ukur penalaran, matematika, dan pemrograman—mendemonstrasikan skalabilitas dan efisiensi GPU AMD Instinct untuk beban kerja AI produksi berskala besar. 

Read More

“Kepemimpinan AMD dalam komputasi terakselerasi memberdayakan inovator seperti Zyphra untuk mendorong batas kemungkinan dalam AI,” kata Emad Barsoum, corporate vice president of AI and engineering, Artificial Intelligence Group, AMD. “Tonggak ini menunjukkan kekuatan dan fleksibilitas GPU AMD Instinct dan jaringan Pensando untuk melatih model kompleks berskala besar.”

“Efisiensi selalu menjadi prinsip utama di Zyphra. Hal ini membentuk cara kami merancang arsitektur model, mengembangkan algoritme pelatihan dan inferensi, serta memilih perangkat keras dengan rasio harga-kinerja terbaik untuk menghadirkan kecerdasan frontier kepada pelanggan kami,” ujar Krithik Puthalath, CEO of Zyphra. “ZAYA1 mencerminkan filosofi ini dan kami bangga menjadi perusahaan pertama yang mendemonstrasikan pelatihan berskala besar di platform AMD. Hasil kami menyoroti kekuatan co-design arsitektur model dengan silikon dan sistem, dan kami bersemangat memperdalam kolaborasi dengan AMD dan IBM dalam membangun generasi berikutnya dari model fondasi multimodal canggih.”

Pelatihan Efisien Berskala Besar, Didukung GPU AMD Instinct

GPU AMD Instinct MI300X dengan 192 GB memori bandwidth tinggi memungkinkan pelatihan berskala besar secara efisien, menghindari kebutuhan sharding ahli atau tensor yang mahal, sehingga mengurangi kompleksitas dan meningkatkan throughput di seluruh tumpukan model. Zyphra juga melaporkan waktu penyimpanan model lebih dari 10x lebih cepat dengan menggunakan I/O terdistribusi yang dioptimalkan AMD, sehingga semakin meningkatkan keandalan dan efisiensi pelatihan. Dengan hanya sebagian kecil parameter aktif, ZAYA1-Base (8,3B total, 760M aktif) menyamai atau melampaui kinerja model seperti Qwen3-4B (Alibaba), Gemma3-12B (Google), Llama-3-8B (Meta), dan OLMoE.

Melanjutkan kerja sama sebelumnya, Zyphra  dengan AMD dan IBM untuk merancang serta menerapkan kluster pelatihan berskala besar yang didukung GPU AMD Instinct™ dengan interkoneksi jaringan AMD Pensando™. Sistem hasil rekayasa bersama AMD dan IBM, yang diumumkan pada kuartal ini, menggabungkan GPU AMD Instinct™ MI300X dengan fabric dan arsitektur penyimpanan berperforma tinggi milik IBM Cloud, menyediakan fondasi bagi pretraining berskala besar ZAYA1.

Untuk detail lebih lanjut mengenai hasil ini, dapat diperoleh pada laporan teknis Zyphra, blog Zyphra, dan blog AMD, yang memberikan gambaran komprehensif tentang arsitektur model ZAYA1, metodologi pelatihan, serta teknologi AMD yang memungkinkan pengembangannya.

Sumber Pendukung

Tentang AMD

Selama lebih dari 50 tahun AMD mendorong inovasi dalam komputasi berkinerja tinggi, grafis, dan teknologi visualisasi. Miliaran orang, perusahaan Fortune 500, dan institusi riset ilmiah terkemuka di seluruh dunia bergantung pada teknologi AMD setiap hari untuk meningkatkan cara mereka hidup, bekerja, dan bermain. Karyawan AMD berfokus pada pembangunan produk adaptif dan berkinerja tinggi yang memimpin pasar serta mendorong batas kemungkinan. Untuk informasi lebih lanjut, kunjungi situs webblogLinkedIn, dan X AMD (NASDAQ: AMD).

Related posts

Leave a Reply