Jero Gancang: Ngirangan hiji revolusi Bentang AI

Grup Waton Waton

Bubuka

Perkawis kahakahan diantara modél anu langkung ageung, panyadia awan saingan pikeun ngabagi pasar pasar, sareng produsén chip

Salaku Festival spring sumping, pikagumbiraeun ngurilingan tetep wilangan anu kuat. Pengebatan panganyarna anu disorot ku akal anu penting dina kaayaan industri téknologi, sareng seueur bahas sareng nganalisa "lele." Silicon Valley ngalaman unga krisis anu teu biasa: Nungtungan sumber kabuka nyaéta ngadorong pendapatan deui, komo kabuka deui resevaluasi naha pilihan pangalusna ieu. Paradigm anyar ngeunaan biaya fasilitas handap anu langkung handap réaksi resiant-ol chip Chicks sapertos Nvidia, nuju ngarékam nilai nilai pasar saham tunggal, sedengkeun agrésaan pamaréntah ti luar ku urang karéta di jero Chipse. Ulang Revies Dang Gursee of Gancang, Domestically, éta ngalaman kamekaran rongkah. Saatos peluncuran modél R1, aplikasi anu aya parantos katingal nganggo sababaraha patalimarga tiasa lalulintas, nunjukkeun yén kamekaran aplikasi bakal nyetir AICYSTem. Aspék anu positif nyaéta kamulyaan anu langkung saé anjeun bakal ngandelkeun kana eon pangit anu moal sapertos mahal di hareup. Pindahkeun ieu parantos dibayangkeun di kagiatan anyar Buka Buka, kalebet panyuntaan modél alesan anu disebut O3 MICI pikeun pangguna bébas tina résolusi o3-minca salajengna anu dilakukeun ku paningkatan o3-minco. Seueur pangguna anu luar biasa anu digedar pikeun jalan jero pikeun pangwangunan ieu, sanaos ranté pikir ieu janten kasimpulan.

Sacara optimis, éta dibuktikeun yén jeroeun anu gaduh pamuter domestik. Sareng fokus na dina ngirangan biaya pelatihan, sababaraha padamelan chip pelijakan, panyadia biaya panengah, sareng seueur pilihan panghubna aktip pikeun ngagunakeun modél overwore. Numutkeun tulak jero jero, Latihan anu lengkep nganel butuh ku 2.788 juta jam jam, sareng prosés latihan pisan stabil. Mél (campuran Keter) Lataréktur penting pikeun ngurangan biaya pre-latihan ku faktor pengecambahan sareng L Alamor 3 sareng 405 milyar. Ayeuna, V3 mangrupikeun modél anu diakui munggaran nunjukkeun speransi luhur anu saé dina mane. Salaku tambahan, MLA (Multi déwatan perhatian) damel sacara sinnungistically, utamina dina aspék penayaan. "Spyser Moe, langkung ageung ukuranna tumpat anu dipikoréngkeun nalika si alesan condong nga ngagunakeun kaayaan kompatatif," mca sacara signifikan Kvcace ti ulasan AA. Sakabéh, kasuksésan jero anu aya dina kombinasi sababaraha téknologi, sanés ngan ukur hiji. Pamidosan industri muji kamampuan runduk tapak jalan damel, henteu terang kana palatihanna dina palatihan parallel sareng optimisasiana dina unggal leteran. Pelanca Sumber Book-Ditambahkeun Odtsee salajengna langkungser Sebelasi model umum sareng modél ageung, sareng diantisikasi nyaéta lamun aya modél sami dimurnakeun, ieu sacara nyata merangsian industri.

Kasempetan pikeun jasa wajib pihak katilu

Data nunjukkeun yén éta pelepasanna, jero jero parantos accruk 22.15 juta pangheulana pangguna aktip saparapat, langkung tina 41.65. Tapi, bari pangguna nyolong dina manuk hampir, hacker cyber parantos nyerang aplikasi jero overseeek, nyababkeun galur anu signifikan dina server na. Istilah Industri percaya ieu sacara sawaréh kusabab kartu anu ngorbankeun latihan pikeun latihan nalika kurang kakuatan kompléks pikeun alesan. Hiji industri insipkeun perusahaan pikeun ngarujuk wasa alamat AI, "masalah pangladén anu sering tiasa dibéréskeun kalayan biaya ngecas atanapi pembiayaan pikeun mésér Mesin." Gumantung kana kaputusan langkung seueur. " Ieu nyababkeun dagang di fokus kana téknologi versus cara produkisasi. Tangkal jeroan geus bener-bener ngandelkeun kuantis kuantum pikeun kategaan diri, ngan nampi dana luar, hasilna dina tekanan alur tunai berlian. Ayeuna, terang tina masalah kasebut, sababaraha pangguna nuju ngahururkeun jero dina média sosial pikeun ningkatkeun kanyamanan pangguna atanapi ngenalkeun fitur pamaké atanapi ngenalkeun fitur pangguneter. Salaku tambahan, pamekar parantos ngabutuhkeun ngamangpaatkeun API resmi atanapi kies pihak katilu kanggo optimal. Tapi, platform kabuka jero anyar kanggo ngumumkeun, "sumber server ayeuna jarang, sareng jasa API nganggungkeun aktor parantos ditunda."

 

Desnti ogé muka kasempetan langkung seueur kasempetan pikeun vendores pihak katilu dina séktor infrastruktur AI. Anyar-anyar, seueur raksasa awan sareng internasional sareng internasional parantos diluncurkeun modél Overse-oversee-overseees giars sareng Amazon aya diantara dina ahir Januari. Pamimpin domestik, awan Huawei, ngadamel gerak mimiti, ngaleupaskeun forsek overn R1 sareng VIPIKLE "parantos katingal ku 1 Pebruari-Fébrihan" Tilu perusahaan Tech Tech (Bata, Aliba, Tencent) sareng Raeds-éta Disanggup biaya 3 taun, pagelaran taun ka tukang Verss taun ka tukang,. Pindah anu ageung padagang gecho gence ditémutan Ans Microsoft sareng Buka, dimana di 2019, Microsoft ngadamel Fray ezos-upah di 2023. Dina conto ieu, jero jero henteu ngan ukur tiasa dicasipkeun kecap tina hawa produk tapi ogé ngenalkeun modél sumber kabuka nuturkeun o1, mirip sareng pikagumbiraeun Llittive-3.

 

Komunitas, Purider Moid ogé ningalikeun diri salaku lower lalulur kanggo aplikasi sareng aplikasi anu panemping anu ditangtoskeun sareng pamekar diarahkeun ka prinepter. Laporan nunjukkeun yén awan pinter sami ngagaduhan 15,000 konsumén ngagunakeun modél Boadsek via platform qianfan dina dinten plation. Salaku tambahan, sababaraha firma anu langkung alit nawiskeun solusi, kalebet aliran aliran cucuk, aliran téknologi ngadorong, sareng alatan infra panulisan. Ux Téknologi Ai parantos diajar anu kalungguhan optimalisasi ayeuna pikeun ngaleungitkeun penerbangan anu langkung lokal aya dina dua daérah: hiji engtope pikeun hiburan Frawdrid 67 miliatur. Salaku tambahan, optimasi MLA penting. Tapi, dua modél jero jero masih aya sababaraha tantangan dina optimasi panyebaran. "Alatan ukuran modél sareng seueur parameter, optimasi mangrupikeun kompleks, khususna pikeun pembebu lokal tempat ngajagaan kasaimbangan anu optimal sareng pagelaran tina téknologi Chujing. Kudu anu paling penting aya dina wates mémori ngarep. "Kami ngadopsi pendekatan kolerasi sareng héter pikeun nyertakeun CPU sareng sumber pangitung anu sanés, nempatkeun bagian-bagian anu teu dibagikeun ka tukang / drive pikeun diolah nganggo GPU / DRAM. Laporan nunjukkeun yén sumber pangecahan anu Chujing Ktransffher sacara khusus utamina ngabédarkeun bibit strategi sareng operator kana ganjaran, langkung ternyata. Ovaneeeke ngagaduhan kasempetan anu didamel pikeun ngamimitian ieu, salaku kauntungan tumuwuh nyaéta éang; Seueur firma parantos ngalaporkeun kamekaran palanggan anu teu jelas saatos ngaluncurkeun API jero Sebugit industri parantos dicatet, "leresna, kelompok klien anu ngadegkeun sering dikonci kana jasa anu langkung ageung perusahaan, tampa di penghasilan jeroan." Salian ski ogé. " Ayeuna, némbongan anu jero sareng jero pagelaran inferensi modél spéstik, sareng nganggo pengaduka modél ageung, ieu bakal terus bakal pangaruh pangwangunan IN AIRRA. Modél anu langkung jero jalan anu langkung saé tiasa disebatkeun sacara lokal dina biaya rendah, éta bakal tiasa nyalira sareng usaha transformasi digital sareng perusahaan digital. Tapi, tangtangan terus, salaku sababaraha klien tiasa nahan ekspektasi anu luhur, ngajantenkeun langkung pikasieuneun yén kinanci saimbang dina penancap praktis dina kinanci saimbang dina penancap praktis dina kinanci saimbang per pagelaran praktis sareng kinerja saimbang dina kinanci damel dina kinanci sateuacan kinerja dina penancel praktis sareng kinerja saimbang prestasi. 

Pikeun evaluasi naha jeroan langkung saé tibatan ChatgTPT, penting pikeun ngartos bédana konci na, sareng panggunaan kasus. Ieu ngabandingkeun kacida bertindakan:

Fitur / aspék Jero Cranknpt
Kapamilikan Dikembangkeun ku perusahaan cina Dikembangkeun ku muka
Model sumber Sumber-sumber Proprietary
Ongkos Bébas dianggo; Pilihan aksés API anu langkung mirah Langganan atanapi mayar-per-pay
Kustusi Kacida maju, ngamungkinkeun pangguna pikeun ngagulung sareng ngawangun kana éta Kustomisasi kawates sayogi
Pagelaran dina tugas khusus Unggul di daérah anu pasti sapertos analytics and inpormasi inpormasi Sagala sareng prestasi anu kuat dina tulisan kreatif sareng tugas paguneman
Dukungan basa Fokus kuat dina basa Cina sareng budaya Cina Dukungan basa lega tapi urang-centrik
Biaya latihan Biaya latihan handap, dioptimalkeun pikeun efisiensi Biaya latihan anu langkung saé, meryogikeun sumber komputasi anu ageung
Beratasan réspon Tiasa nawiskeun réspon anu béda, kamungkinan dipangaruhan ku kontéks geopolitik Jawaban konsisten dumasar kana data latihan
Target pamiarsa Ditujukeun dina pamekar sareng panaliti hoyong kalenturan Tujuan dina pangguna umum milarian kamampuan panggunaan
Anggo kasus Langkung efisien pikeun generasi kode sareng tugas gancang Idéal pikeun ngahasilkeun téks, ngawalon patarosan, sareng kéngingkeun dialog

Persih anu kritis dina "ngaganggu nvidia"

Dinten ayeuna, kumisan ti Huawei, sababaraha buah produsén domistik sapertos juru hibes, Muxi, téknologi Birne, sareng Tanxu Zhonu ogé ngémutan dua model jero jeroeun. Presses foldasi dinteunkeun AIA AIA, "struktur Spreeekusi, nunjukkeun inovasi, pas tetep aya llm. Salian ti indivasi." Tapi, pendekatan mane peryogi tungtutan anu luhur dina hal pendorna sareng distribusi, ditambah ku épéktipikasi rumah tangga anu peryogi seueur tantangan domestik anu peryogi seueur tantangan domestik anu peryogi seueur tantangan domestik anu bade incitmen cutatan domestik anu bade incitusi pikeun resolasi. "Ayeuna, kakuatan folnicatk rumah tangga henteu cocog sareng nvidia langsung dianggupan sareng resabilitasna, ngahasilkeun partisipasi lingkungan lipet, ngungkulan industri Software, sareng pangalaman praktis, sareng optekumsi industri, sareng opsional, sareng pangalaman praktisi, sareng pangalaman praktis, ucing dumasar kana pangalaman praktis." Inputtilay dumasar kana pangalaman praktis. "Akarat. Sakaligus, "Alatan skenter Parameter Goréng R1, Korot Daérah anu kedah diperyogikeun deui langkung unggul pikeun Paralelasi. Salah sahiji sorot tina modél Transsek V3 mangrupikeun perkembangan latihan fption anu dicampur, anu nembé sacara efektif dina modél anu ageung ageung, niru prestasi anu penting. Sateuacanna, pamaén utama sapertos Microsoft sareng NVidia nyarankeun, tapi Rukupu léner dina industri ngeunaan kemitan. Éta dipercaya yén dibandingkeun sareng INT8, kauntungan utami FP8 nyaéta yén jumlah latihan anu tiasa ngahontal precision anu henteu aya gunana bari ningkatkeun kacepetan moverfer. Nalika ngabandingkeun FP16, FP8 tiasa sadar dugi ka dua kali percepatan NVIDIA H20 sareng langkung 1,5 kali percelip dina H100. Biasa, janten diskusi di sekitar trend kakuatan komputal domestik tambah model domestik numpul domestik, Spustional ngeunaan naha Cuda tiasa digentos, beat anu dikandung, sareng naha Cuda tiasa digentos, sareng naha Cuda. Salah sahiji kanyataan anu henteu bisa dipercaya nyaéta jero jeroan parantos nyababkeun lunggasi anu ageung dina nilai pasar nversia, tapi transpénsi ieu ngahasilkeun integrabilitas fompatif endasial tinggi Nevdia-end. Sateuacana anu ditampi sacara narebalan ngeunaan akumulasi kompisional anu dicirikeun bakal diantepkeun, tapi tetep heurat pikeun Nvidia kanggo digantikeun dina skenario lengkep. Analysis of DeepSeek's deep usage of CUDA shows that flexibility—such as using SM for communication or directly manipulating network cards—is not feasible for regular GPUs to accommodate. Tekanan industri ngantebkeun yén moat Nveridia nyumput sadayana ékosistem CUA sateuacana, sareng PTX (palaksanaan Paralel, petunjuk Paralels masih aya bagian tina ékossi anu jero masih aya bagian tina ékosistem Paralel. "Dina istilah pondok, kakuatan komputasi NVIDIA henteu tiasa digentoskeun-ieu hususna jelas dina latihan domestik pikeun masalah domestik dina skor deet anu réproduksi. Gemblengna, tina sudut pandukan invaderisi, kaayaan éta nyorong model anu ageung domestik. Kasempetan pikeun produsén chip domestik dina kaayaan realperte langkung dibuktikeun kusabab latihan anu langkung ageung, anu ngahalangan éntri. Nganalisis anu ngan saukur ngaleungitkeun kartu inferensi domestik; Upami diperyogikeun, ngayakeun mesin tambahan, sedengkeun model latihan nyiptakeun taksi anu unik-ngaturkeun jumlah mesin junggik, sareng ongkos nyata tiasa dampakna tiasa dirobih. Pelatihan ogé gaduh syarat skala klimén husus, sedengkeun tungtén klaster alat pikeun formasi henteu janten stredent, sahingga ngéstén GPU. Ayeuna, kinerja kartu H 1 tunggal NVIDIA henteu langkungna yén Huawei atanapi CaBrian; Kakuatanana aya dina klaster. Dumasar pangaruhna sakabéh dina pasar listrik, tukang nangkep téknologi losen, anjeun kagunari, "Intenter-earvasi anu dipikaresep. Pandu pendaptaran anu ngadukung di pasar kakuatan komputer. " Salaku tambahan, "paménta di luhur pikeun jasa alesan sareng séhat langkung cocog sareng bentang komputer folnial, dimana kamampuan lokal sacara jarang pisan, ieu mangrupikeun kasempetan kompatas anu béda." Téknologi Luchen ngagaduhan kolaborasi sareng HUUUin awan pikeun ngaluncurkeun pegat oversek R1sek R1sek R1s sareng jasa imbing dumasar kana kakawasaan kompatasional domestik. Anjeun Yang dikedalkeun optimis ngeunaan masa depan: "Masta GreSekes Unplills kapercayaan dina solusi anu domestik dina solusi domestik, ngadorong semangat sareng investasi anu langkung ageung bakal diteruskeun."

微信图片 _20240614024031.jpg1

Kacindekan

Naha jeroan "langkung saé" tibatan chatgnt gumantung kana kabutuhan sareng tujuan khusus pangguna. Pikeun tugasna peryogi kalenturan, biaya rendah, sareng kustomisasi, jeroe tiasa langkung unggul. Pikeun tulisan kreatif, inta-inual umum, sareng zat guning paguneman anu ramah, ChatgPT tiasa dicandak. Unggal sosying ngagambarkeun tujuan anu béda, janten pilihan bakal gumantung kana kontéks anu aranjeunna dianggo.

Milarian solusi kabel ELV

Kabel kadali

Pikeun BMS, beus, industri, internasional, internal.

Sistem anu dirobih terstruktur

Jaringan & data, kabel optik-optik, patch, modul, nyanghareupan

2024 paméran & acara ulasan

Apr.16th-18, 2024 tengah-wétan-wétan di Dubai

Apr.16th-18, 2024 Security di Moskow

Mei.9th, 2024 produk anyar & téknologi peluncuran di Shanghai di Shanghai

Oct.22nd-25th, 2024 kaamanan Cina di Beijing

Nov.19-20, 2024 Dunia Dunia Kuna


Waktu Pasang: Feb-10-2025