chevron_left

メインカテゴリーを選択しなおす

cancel
hiromi
フォロー
住所
未設定
出身
未設定
ブログ村参加

2018/12/09

arrow_drop_down
  • Model Difusi Baru dan Efisien untuk Restorasi Gambar yang Mengurangi Jumlah Langkah Difusi

    Pendahuluan Restorasi gambar (IR) merupakan tugas penting dalam visi komputer, yang berupaya memulihkan gambar berkualitas tinggi dari versi yang rusak. Metode tradisional telah berkembang, tetapi model difusi baru-baru ini muncul sebagai solusi yang kuat untuk restorasi gambar. Namun, model difusi yang ada seringkali membutuhkan banyak langkah untuk menghasilkan hasil yang baik, sehingga memperlambat proses restorasi. Model Difusi Baru Para peneliti telah mengembangkan model difusi baru (seperti yang ditunjukkan pada Gambar 2) yang dirancang khusus untuk membuat proses restorasi gambar lebih cepat dan lebih efektif. Model ini berawal dari wawasan sederhana: mengapa memulai restorasi gambar dari awal (seperti dengan noise acak) ketika kita sudah memiliki versi gambar yang rusak? Model mereka dengan cerdas menggunakan gambar yang rusak sebagai dasar untuk memulihkan versi asli yang berkualitas tinggi. Keunggulan model difusi baru ini (ResShift) terletak pada cara cerdasnya menggeser perbedaan (atau residual) a

  • Peneliti MIT Kembangkan Dataset Gambar yang Memungkinkan Simulasi Penglihatan Perifer dalam Model Pembelajaran Mesin

    Pendahuluan Penglihatan perifer, yang merepresentasikan dunia dengan tingkat ketelitian yang menurun pada eksentrisitas yang lebih besar, memainkan peran penting dalam pemrosesan visual manusia tetapi sering diabaikan dalam sistem visi komputer. Artikel ini membahas pengembangan dataset gambar yang memungkinkan simulasi penglihatan perifer dalam model pembelajaran mesin, untuk menjembatani kesenjangan antara persepsi manusia dan mesin. Metode Peneliti MIT mengembangkan Model Tiling Tekstur (TTM) yang dimodifikasi menjadi Model Tiling Tekstur Seragam (uniformTTM) untuk menghasilkan gambar yang diubah untuk menangkap informasi yang tersedia dalam penglihatan perifer manusia. Dataset COCO diubah menggunakan uniformTTM untuk membuat COCO-Periph, yang berisi gambar yang disimulasikan pada berbagai eksentrisitas penglihatan perifer. Eksperimen dan Hasil Eksperimen psikofisika mengevaluasi kinerja manusia dan DNN dalam deteksi objek perifer. Hasilnya menunjukkan bahwa DNN yang dilatih pada COCO-Periph menunjukkan pe

  • Anthropic dan Google Cloud Bekerja Sama untuk Membawa Model AI Claude 3 yang Canggih ke Vertex AI

    Pendahuluan Anthropic telah mencapai tonggak penting dalam kecerdasan buatan dengan mengumumkan ketersediaan umum Claude 3 Haiku dan Claude 3 Sonnet pada platform Vertex AI Google Cloud. Perkembangan ini menandai tonggak sejarah dalam membuat teknologi AI canggih lebih mudah diakses oleh perusahaan, memanfaatkan infrastruktur Google Cloud untuk menawarkan solusi yang cerdas, efisien, dan hemat biaya. Kolaborasi yang Berfokus pada Keamanan dan Privasi Kemitraan ini menggarisbawahi komitmen bersama terhadap privasi dan keamanan data, yang bertujuan untuk memberdayakan organisasi untuk menerapkan solusi AI dengan mudah sambil mengelola data mereka dalam lingkungan Google Cloud. Integrasi Claude yang Berhasil Integrasi Claude ke dalam aplikasi Poe Quora merupakan bukti potensi transformatif dari AI Anthropic. Dengan memungkinkan pengguna terlibat dalam percakapan alami dengan AI, Poe telah merevolusi cara orang berinteraksi dengan kecerdasan buatan. Penerapan nyata dari kekuatan Claude dalam [kemampuan AI tertent

  • Proyek GR00T NVIDIA: Revolusi Interaksi Manusia-Robot

    NVIDIA memperkenalkan Proyek GR00T, model dasar unik untuk robot humanoid, dan komitmennya terhadap Platform Robotik Isaac dan Sistem Operasi Robot (ROS). Proyek ini menandai lompatan signifikan dalam pengembangan dan penerapan AI dalam robotika. Model Dasar GR00T GR00T berfokus pada pemrosesan bahasa alami dan meniru gerakan manusia. Hal ini memungkinkan robot untuk memahami dan berinteraksi dengan dunia di sekitar mereka dengan tingkat koordinasi, ketangkasan, dan kemampuan beradaptasi yang belum pernah ada sebelumnya. Teknologi Pendukung Platform komputasi baru NVIDIA, Jetson Thor, mendukung kemajuan ini dengan memanfaatkan arsitektur GPU Blackwell untuk memberikan daya komputasi yang diperlukan untuk tugas-tugas kompleks ini. Kolaborasi dan Kemitraan NVIDIA mengumumkan perannya sebagai anggota platinum pendiri Open Source Robotics Alliance (OSRA). Inisiatif ini mendukung ekosistem ROS, memastikan kelangsungan jangka panjang dan mendorong keterlibatan serta tata kelola komunitas yang lebih besar. Kemitraan

  • VideoMamba: Model AI Berbasis SSM Murni untuk Pemahaman Video yang Efisien

    Pemahaman Video Pemahaman video adalah domain kompleks yang melibatkan penguraian dan penafsiran konten visual dan dinamika temporal dalam urutan video. Metode tradisional seperti jaringan saraf konvolusional 3D (CNN) dan transformator video telah membuat kemajuan signifikan, tetapi sering kali kesulitan untuk mengatasi redundansi lokal dan ketergantungan global secara efektif. VideoMamba Di sinilah VideoMamba berperan, mengusulkan pendekatan baru dengan memanfaatkan kekuatan Model Ruang Keadaan (SSM) yang dirancang khusus untuk data video. VideoMamba dimotivasi oleh tantangan pemodelan konteks spasiotemporal dinamis secara efisien dalam video berdurasi panjang dan beresolusi tinggi. VideoMamba menonjol dengan menggabungkan keunggulan mekanisme konvolusi dan perhatian dalam kerangka Model Ruang Keadaan, menawarkan solusi kompleksitas linier untuk pemodelan konteks dinamis. Desain ini memastikan skalabilitas tanpa pelatihan awal yang ekstensif, meningkatkan sensitivitas untuk mengenali tindakan jangka pendek y

  • Survei Konflik Pengetahuan pada Model Bahasa Besar: Jalan Menuju Akurasi dan Keandalan yang Lebih Baik

    Pendahuluan Model bahasa besar (LLM) telah menjadi pusat perhatian dalam kecerdasan buatan, mendorong kemajuan dalam banyak aplikasi, mulai dari meningkatkan AI percakapan hingga menjalankan tugas analitis yang kompleks. Inti dari fungsinya terletak pada kemampuannya untuk menyaring dan menerapkan gudang pengetahuan yang dikodekan yang diperoleh melalui pelatihan menyeluruh pada kumpulan data yang luas. Kekuatan ini juga menimbulkan serangkaian tantangan unik, terutama masalah konflik pengetahuan. Konflik Pengetahuan Konflik pengetahuan adalah benturan antara informasi statis dan pra-pelajari LLM dengan data real-time yang terus berkembang yang mereka temui setelah penerapan. Ini bukan hanya masalah akademis tetapi juga masalah praktis, yang memengaruhi keandalan dan efektivitas model. Misalnya, saat menafsirkan masukan pengguna baru atau peristiwa terkini, LLM mungkin mendamaikan informasi baru ini dengan basis pengetahuan mereka yang sudah ada dan mungkin sudah ketinggalan zaman. Pendekatan Mengatasi Konfli

  • Revolusi GPU NVIDIA Blackwell: Menghadirkan Gelombang Baru AI dan Komputasi Kinerja Tinggi

    Di era transformasi yang didorong oleh AI dan tuntutan komputasi yang meningkat, NVIDIA meluncurkan platform Blackwell, yang muncul sebagai pengubah permainan. Dinamai sesuai nama matematikawan terkenal David Harold Blackwell, platform ini akan merevolusi AI dan HPC dengan GPU inovatifnya, B100 dan B200 yang akan datang. GPU B100 dan B200: Akselerator AI Terdepan GPU B100, yang dijadwalkan debut pada tahun 2024, dan penerusnya, B200, yang direncanakan pada tahun 2025, adalah akselerator AI mutakhir dari NVIDIA. Dell, mitra utama dan calon pelanggan, telah membagikan garis waktu dan ekspektasi untuk GPU ini, menggarisbawahi peran penting mereka dalam pusat data AI. Arsitektur Blackwell: Mengarah ke Keunggulan AI dan Komputasi Arsitektur Blackwell, yang menampilkan kombinasi Superchip GB200 “Grace Blackwell” dan platform GB200NVL yang saling terhubung untuk superkomputasi, menunjukkan ambisi NVIDIA untuk memimpin dalam domain perangkat keras yang siap untuk AI dan komputasi. Proses Manufaktur 3nm: Efisiensi dan

  • Ancaman yang Muncul dari Deepfake AI dalam Pemilu Global

    Pendahuluan Saat para pemilih di seluruh dunia bersiap untuk memberikan suara mereka dalam pemilu nasional mendatang, sebuah bentuk kecerdasan buatan baru yang kuat yang dikenal sebagai “deepfake” mengancam untuk menjungkirbalikkan wacana politik dan menabur kebingungan serta ketidakpercayaan dalam skala besar. Apa itu Deepfake? Deepfake adalah video atau rekaman audio palsu yang sangat realistis yang dihasilkan oleh algoritme pembelajaran mesin. Teknologi ini telah berkembang pesat dalam kecanggihannya hingga seringkali tidak dapat dibedakan dari konten asli bagi mata yang tidak terlatih. Potensi Ancaman dalam Pemilu Meskipun teknologi ini memiliki aplikasi yang tidak berbahaya dalam hiburan dan seni, teknologi ini juga berpotensi dijadikan senjata untuk penipuan politik dan propaganda menjelang pemilu penting di AS, Brasil, Nigeria, Taiwan, dan negara-negara demokrasi lainnya selama dua tahun ke depan. Dampak pada Pemilu Para ahli memperingatkan bahwa deepfake dapat menyebabkan: Kebingungan Pemilih: Orang m

  • Jaringan Daya Komputasi Terdesentralisasi Revolusioner Dekube untuk Demokratisasi Pengembangan AI

    Pengantar Dalam langkah penting yang siap mengubah lanskap pengembangan Kecerdasan Buatan (AI), Dekube telah mengumumkan peluncuran jaringan daya komputasi terdesentralisasinya. Platform inovatif ini memungkinkan usaha kecil dan menengah atau pengembang individu untuk membuat model berskala besar, mengatasi tantangan kritis biaya tinggi dan dampak lingkungan dari proses pelatihan AI saat ini. Tantangan Pengembangan AI Teknologi AI, meskipun berkembang pesat, sebagian besar didominasi oleh raksasa teknologi karena biaya pelatihan dan pengembangan model AI yang sangat tinggi. Sam Altman, CEO OpenAI, telah menyoroti bahwa model pelatihan seperti Chat GPT4 dapat menghabiskan biaya sekitar $100 juta, jumlah yang jauh di luar jangkauan sebagian besar perusahaan. Hambatan finansial ini telah membuat lanskap AI berisiko dimonopoli, menghambat inovasi dan keberagaman. Solusi Dekube Jaringan terdesentralisasi Dekube, yang dibangun di atas arsitektur Kubernetes dan lapisan peer-to-peer yang disempurnakan, memanfaatkan s

  • Talkdesk Perluas AI dan Integrasi Kesehatan dengan Peningkatan Autopilot

    Kecerdasan Buatan Generatif dalam Perawatan Kesehatan Kecerdasan buatan generatif, dikombinasikan dengan alur kerja perawatan kesehatan yang terintegrasi dan spesifik, memberikan layanan mandiri yang kuat untuk meningkatkan pengalaman dan mengurangi beban pada agen pusat kontak manusia. Talkdesk Autopilot untuk Perawatan Kesehatan Talkdesk, Inc., pemimpin pusat kontak bertenaga AI global untuk perusahaan dari semua ukuran, terus mempercepat dan mempermudah organisasi untuk memanfaatkan kecerdasan buatan generatif (GenAI) untuk membuka efisiensi baru yang kuat di pusat kontak. Mempercepat visinya tentang pengalaman pelanggan (CX) otonom dan membangun pengumuman Talkdesk Autopilot baru-baru ini, perusahaan memperkenalkan Talkdesk Autopilot untuk Perawatan Kesehatan, generasi berikutnya dari agen virtual ikoniknya yang dikembangkan khusus untuk menangani kasus penggunaan pasien dan anggota. Talkdesk Autopilot untuk Perawatan Kesehatan diluncurkan hari ini di Konferensi dan Pameran Global Sistem Informasi dan Man

  • Kecerdasan Percakapan Gen AI SAIGE dari Sapia.ai untuk Manajemen Talenta

    Pendahuluan Sapia.ai, pemimpin dalam solusi kecerdasan buatan (AI) di tempat kerja, meluncurkan SAIGE, model AI generatif yang siap mengubah cara organisasi secara global memilih, mengelola, dan mengoptimalkan tenaga kerja mereka. Evaluasi Kandidat yang Adil dan Skalabilitas Memanfaatkan kemampuan model bahasa besar (LLM) eksklusif yang dikembangkan selama enam tahun, SAIGE™ mengevaluasi kandidat secara massal menggunakan wawancara obrolan buta, memberikan skor komprehensif bersama dengan serangkaian kompetensi terkait pekerjaan, termasuk penjelasan transparan untuk penilaiannya. Dibandingkan dengan pengurai resume yang mengevaluasi catatan historis yang dikodekan dengan berbagai bias, SAIGE™ memungkinkan organisasi untuk melakukan percakapan dengan setiap kandidat dan menilai potensi mereka agar sesuai dengan peran tersebut. Dasar yang Kuat untuk Penilaian Tidak seperti solusi yang dibangun pada LLM tujuan umum yang ada seperti GPT-4 atau PaLM, fondasi SAIGE™ adalah LLM eksklusif canggih yang disetel dengan

  • Tren Perekrutan AI yang Diungkap CareerBuilder

    CareerBuilder, bekerja sama dengan Morning Consult, sebuah perusahaan intelijen global, merilis buku putih “AI dalam Perekrutan” berdasarkan survei terhadap 400 pengambil keputusan perekrutan. Tanggapan mereka menyoroti prevalensi teknologi AI dalam perekrutan, aplikasi yang paling umum, kekhawatiran utama, dan prediksi tentang bagaimana AI akan membentuk kembali tim perekrutan. Manfaat dan Keterbatasan AI “Karena AI dengan cepat mengubah praktik rekrutmen, penting bagi para pemimpin SDM untuk memahami manfaat dan keterbatasannya,” kata Kristin Kelley, Chief Revenue and Marketing Officer CareerBuilder. “Berdasarkan hasil survei, kami bertujuan untuk memberdayakan tim perekrutan untuk memanfaatkan teknologi AI secara bertanggung jawab sambil mempertahankan faktor manusia yang penting untuk pengalaman kandidat yang luar biasa.” Aplikasi AI dalam Perekrutan Hampir setengah (47%) profesional perekrutan yang disurvei mengatakan mereka menggunakan AI. Di antara sorotan lainnya: Aplikasi AI teratas dalam perekrutan

  • Pembaruan Harian AI: Pembaruan Pembelajaran Mesin, Robotik, dan Otomatisasi Terbesar

    Akuisisi Splunk oleh Cisco Cisco telah menyelesaikan akuisisi Splunk, yang akan memberikan visibilitas dan wawasan yang tak tertandingi di seluruh jejak digital organisasi. Untuk berkembang di era digital baru, organisasi harus menghubungkan dan melindungi semua yang mereka lakukan. Mereka perlu menghubungkan orang, tempat, aplikasi, data, dan perangkat yang mendukung bisnis mereka sekaligus melindungi seluruh jejak digital mereka dari ancaman keamanan siber, waktu henti, dan risiko bisnis kritis lainnya. Mengatur Deepfake AI pada Tahun 2024: Tantangan Terbesar bagi Negara Lebih dari empat miliar orang di seluruh dunia akan mengikuti pemilu tahun ini, termasuk di AS, Inggris, India, dan Afrika Selatan. Namun, semakin maraknya disinformasi, yang didorong oleh penggunaan deepfake dan AI generatif yang semakin meningkat, berarti politisi dan pemilih sama-sama harus waspada. GoCardless Menandatangani Perjanjian untuk Mengakuisisi Nuapay GoCardless, perusahaan pembayaran bank, telah menandatangani perjanjian untuk

  • Kecerdasan Buatan Ubah Ritel Konvensional dengan Wawasan Inovatif Perjalanan Pelanggan

    Peningkatan Wawasan Ritel Spasial Dragonfruit AI, penyedia solusi analitik ritel inovatif terkemuka dari aplikasi visi komputer bertenaga AI, dengan bangga mengumumkan peningkatan besar pada aplikasi Wawasan Ritel Spasialnya. Pembaruan ini siap merevolusi lanskap analitik ritel, menawarkan wawasan yang belum pernah ada sebelumnya kepada Pengecer tentang kinerja toko dan perilaku pelanggan dalam skala besar menggunakan sistem kamera video yang ada. “Kami sangat senang untuk mengungkap pembaruan fantastis ini untuk aplikasi Wawasan Ritel Spasial kami,” kata Amit Kumar, Pendiri dan CEO Dragonfruit AI. “Tim kami telah bekerja keras untuk meningkatkan pengalaman pengguna, mendengarkan pelanggan kami dan kebutuhan mereka, dan kami sangat antusias untuk memperkenalkan tiga jenis laporan baru yang akan memberdayakan pengecer untuk membuat keputusan berbasis data dan mendorong kesuksesan.” Jenis Laporan Baru Jenis laporan baru meliputi: Laporan Jendela Belanja: Ingin tahu tentang efektivitas pajangan jendela Anda? Lap

  • MAXHUB Bangun Solusi AI Canggih dengan Microsoft Azure Cloud untuk Dorong Pertumbuhan Bisnis Global

    Integrasi dengan Azure MAXHUB, penyedia terkemuka solusi komunikasi kolaboratif dan tampilan interaktif, dengan bangga mengumumkan akan mengintegrasikan teknologi Microsoft Azure. MAXHUB akan memanfaatkan kekuatan Azure untuk secara signifikan memperkuat pertumbuhan bisnis internasionalnya dan memajukan teknologi AI lebih jauh. Arsitektur Terdistribusi Global Di tengah perluasan cakrawala bisnis global, MAXHUB terintegrasi dengan Microsoft Azure untuk memberdayakan dirinya dengan memenuhi kebutuhan yang melonjak untuk komputasi dan penyimpanan cloud yang dapat diskalakan. MAXHUB berbagi data dengan mulus di beberapa pusat data global menggunakan kemampuan kuat Azure Cosmos DB dan Blob Storage. Dengan memisahkan data bisnis dasar dari data privasi pribadi dan mengintegrasikan dengan Azure Kubernetes Services, MAXHUB telah membangun arsitektur terdistribusi global untuk menyebarkan layanan utama seperti OTA (Over-The-Air) dan CMS (sistem manajemen konten). Pengaturan ini dirancang khusus untuk manajemen operasi

  • Tim Eksekutif OnsiteIQ Kini Lengkap dengan Rekrutmen VP Pemasaran Baru

    Pendahuluan Untuk mendukung pertumbuhan pesat OnsiteIQ, Platform Pengembangan Real Estat berbasis AI pertama menyambut Andrea Neiman untuk memimpin pemasaran. Andrea Neiman Bergabung dengan OnsiteIQ Dengan penambahan Andrea Neiman baru-baru ini sebagai VP Pemasaran, OnsiteIQ melengkapi pencarian eksekutifnya saat membuka jalan untuk menjadi pemimpin kategori di bidang teknologi real estat. Andrea Neiman telah menghabiskan hampir 20 tahun karir pemasarannya untuk mendefinisikan ulang merek dan memperkenalkan produk ke pasar global dan khusus untuk usaha kecil-menengah hingga merek B2B berskala perusahaan—dari NetLine, BuildingConnected, dan Velocity Global hingga Logitech, Adobe, TIBCO, Kensington (divisi dari ACCO Brands), dan yang terbaru Autodesk. Sebelum bergabung dengan OnsiteIQ, Neiman bergabung dengan BuildingConnected, yang diakuisisi oleh Autodesk pada tahun 2019, untuk memimpin tim Pemasaran Produknya. Dia berperan penting dalam mempelopori posisi perusahaan di bidang Manajemen Penawaran Konstruksi y

  • Platform Manajemen dan Analisis Data Kesehatan Terpadu dari Apixio

    PengantarApixio telah menjadi pelopor dalam pemanfaatan data kesehatan terstruktur dan tidak terstruktur untuk solusi penyesuaian risiko dan integritas pembayaran berbasis AI selama lebih dari satu dekade. Hari ini, mereka mengumumkan peluncuran Apixio Health Data Nexus™, inti dari Connected Care Platform yang dirancang untuk merevolusi cara data kesehatan diintegrasikan, dianalisis, dan dimanfaatkan untuk mendorong hasil positif di seluruh ekosistem perawatan kesehatan. Mengatasi Tantangan Data dalam Perawatan KesehatanHealth Data Nexus memperluas penawaran solusi Apixio untuk mengatasi tantangan akses dan fragmentasi data yang sudah lama ada dalam industri perawatan kesehatan, menawarkan solusi komprehensif yang memberdayakan penyedia dan penyedia layanan kesehatan untuk membuka kekuatan data kesehatan. Industri perawatan kesehatan menyumbang hampir 30% dari total volume data global, dengan organisasi perawatan kesehatan menghasilkan sekitar 137 terabyte data setiap hari. Namun, kekayaan data terstruktur da

  • Model Kecerdasan Buatan Resolusi Tinggi Griffon v2: Acuan Objek Fleksibel melalui Isyarat Tekstual dan Visual

    Pendahuluan Model Bahasa Visi Besar (LVLMs) telah menunjukkan kinerja luar biasa dalam tugas yang membutuhkan pemahaman teks dan gambar. Kemajuan ini sangat terlihat dalam tugas tingkat wilayah seperti Pemahaman Ekspresi Acuan (REC), setelah perkembangan pemahaman dan penalaran gambar-teks. Model seperti Griffon telah menunjukkan kinerja luar biasa dalam tugas seperti deteksi objek, menunjukkan kemajuan besar dalam persepsi di dalam LVLMs. Perkembangan ini telah mendorong penelitian tambahan tentang penggunaan referensi fleksibel di luar deskripsi tekstual untuk meningkatkan antarmuka pengguna. Batasan LVLMs Meskipun ada kemajuan luar biasa dalam persepsi objek berbutir halus, LVLMs tidak dapat mengungguli spesialis tugas khusus dalam skenario kompleks karena batasan resolusi gambar. Pembatasan ini membatasi kapasitas mereka untuk merujuk objek secara efisien dengan isyarat tekstual dan visual, terutama di area seperti Agen GUI dan aktivitas penghitungan. Griffon v2: Model Resolusi Tinggi Untuk mengatasi hal

  • Kerangka RA-ISF: Kecerdasan Buatan yang Dirancang untuk Meningkatkan Efek Augmentasi Pengambilan dan Meningkatkan Kinerja dalam Tanya Jawab Domain Terbuka

    Pendahuluan Model bahasa besar (LLM) telah mengalami kemajuan pesat, memungkinkan mesin untuk memahami dan menghasilkan teks seperti manusia. Namun, model-model ini menghadapi tantangan inheren karena pengetahuan mereka terpaku pada titik pelatihan. Keterbatasan ini membatasi kemampuan beradaptasi mereka dan membatasi kemampuan mereka untuk mengasimilasi informasi baru dan terkini setelah pelatihan, yang menjadi hambatan kritis untuk aplikasi yang membutuhkan data terkini. Teknik Augmentasi Pengambilan Penelitian saat ini telah mengarah pada teknik augmentasi pengambilan (RAG) untuk menjembatani kesenjangan antara basis pengetahuan statis dan kebutuhan informasi dinamis. Metode RAG memberdayakan model untuk mengambil dan menggabungkan informasi eksternal, memperluas wawasan mereka di luar kumpulan data asli. Kemampuan ini sangat penting, terutama dalam skenario di mana relevansi dan ketepatan waktu informasi dapat secara signifikan memengaruhi akurasi dan keandalan keluaran model. Kerangka RA-ISF Peneliti dar

  • Penelitian Pembelajaran Mesin dari ServiceNow Mengusulkan WorkArena dan BrowserGym: Sebuah Langkah Menuju Otomatisasi Alur Kerja Harian dengan AI

    Di era digital, antarmuka yang digunakan individu untuk berinteraksi dengan perangkat lunak menjadi tulang punggung interaksi dengan teknologi. Meskipun ada kemajuan signifikan menuju desain yang ramah pengguna, individu sering kali membutuhkan bantuan dalam menghadapi kompleksitas atau pengulangan tugas tertentu. Hal ini menjadi penghalang besar bagi efisiensi dan inklusivitas di ruang kerja digital, menyoroti kebutuhan kritis akan solusi inovatif untuk menyederhanakan interaksi ini, membuat teknologi lebih mudah diakses dan intuitif bagi semua orang. Tantangan Ruang Kerja Digital Salah satu tantangan utama ruang kerja digital adalah sistem perangkat lunak yang memprioritaskan fungsionalitas komprehensif dengan mengorbankan pengalaman pengguna. Lingkungan seperti itu sering kali menyebabkan kurva pembelajaran yang curam dan penurunan produktivitas, terutama dalam perangkat lunak perusahaan. Kebutuhan akan solusi menjadi jelas, solusi yang tidak hanya menyederhanakan pelaksanaan tugas berulang tetapi juga mem

  • Apple Berencana Melakukan Lompatan AI Revolusioner: Dalam Pembicaraan untuk Mengintegrasikan Mesin Gemini Google ke dalam iPhone

    Pendahuluan Dalam berita terobosan yang membuat industri teknologi ramai, Apple dilaporkan sedang dalam diskusi dengan Google untuk memasukkan mesin kecerdasan buatan (AI) Gemini Google ke dalam iPhone. Kolaborasi ini dapat secara signifikan meningkatkan fitur AI pada iPhone dan berpotensi menetapkan standar baru untuk kemampuan ponsel cerdas. Kemitraan dengan Google dan OpenAI Selain Google, Apple juga telah menjajaki percakapan dengan OpenAI, yang didukung oleh Microsoft, menunjukkan minatnya untuk memanfaatkan teknologi AI terbaik yang tersedia untuk meningkatkan perangkatnya. Fitur Gemini yang Diusulkan Ketertarikan untuk mengintegrasikan Gemini ke dalam iPhone menggarisbawahi komitmen Apple untuk tetap berada di garis depan revolusi AI. Gemini, yang dikenal dengan kemampuan AI canggihnya, dapat menyediakan pengguna iPhone dengan fitur yang belum pernah ada sebelumnya, termasuk fungsi AI generatif yang dapat membuat gambar dan dukungan penulisan berdasarkan petunjuk sederhana. Ini akan menandai lompatan m

  • Model Pembelajaran Mesin Terpadu untuk Analisis Deret Waktu

    Analisis deret waktu sangat penting dalam keuangan, perawatan kesehatan, dan pemantauan lingkungan. Bidang ini menghadapi tantangan besar: heterogenitas data deret waktu, yang ditandai dengan panjang, dimensi, dan persyaratan tugas yang bervariasi seperti peramalan dan klasifikasi. Secara tradisional, menangani kumpulan data yang beragam ini memerlukan model khusus tugas yang disesuaikan untuk setiap permintaan analisis yang unik. Pendekatan ini, meskipun efektif, membutuhkan banyak sumber daya dan membutuhkan lebih banyak fleksibilitas untuk aplikasi yang luas. UniTS: Model Deret Waktu Terpadu yang Revolusioner UniTS, model deret waktu terpadu yang revolusioner, merupakan hasil dari upaya kolaboratif para peneliti dari Universitas Harvard, Laboratorium Lincoln MIT, dan Universitas Virginia. Model ini membebaskan diri dari keterbatasan model tradisional, menawarkan alat serbaguna yang dapat menangani berbagai tugas deret waktu tanpa perlu penyesuaian individual. Yang benar-benar membedakan UniTS adalah arsite

  • Pembaruan Mingguan AiThority: Pembaruan Terbaru Machine Learning, Robotika, dan Otomatisasi

    Penambahan Kemampuan Generatif AI Baru pada Oracle Fusion Cloud Applications Suite Oracle mengumumkan kemampuan AI generatif baru dalam Oracle Fusion Cloud Applications Suite yang akan membantu pelanggan meningkatkan pengambilan keputusan dan meningkatkan pengalaman karyawan dan pelanggan. Penambahan AI terbaru mencakup kemampuan AI generatif baru yang disematkan dalam alur kerja bisnis yang ada di seluruh keuangan, rantai pasokan, SDM, penjualan, pemasaran, dan layanan, serta perluasan kerangka kerja ekstensibilitas Oracle Guided Journeys untuk memungkinkan pelanggan dan mitra menggabungkan lebih banyak kemampuan AI generatif untuk mendukung industri unik mereka dan kebutuhan kompetitif. Box Memperluas Kolaborasinya dengan Microsoft dengan Integrasi Layanan Azure OpenAI Baru Box, Content Cloud terkemuka, mengumumkan integrasi baru dengan Microsoft Azure OpenAI Service untuk menghadirkan model bahasa besarnya yang canggih ke Box AI. Integrasi Azure OpenAI Service memungkinkan pelanggan Box memperoleh manfaat

  • LocalMamba: Merevolusi Persepsi Visual dengan Model Ruang Keadaan Inovatif untuk Peningkatan Pengambilan Ketergantungan Lokal

    Pendahuluan Kemajuan pesat dalam visi komputer telah memperluas batas bagaimana mesin menafsirkan informasi visual yang kompleks. Salah satu tantangan penting dalam bidang ini adalah menafsirkan detail gambar yang rumit secara tepat, yang menuntut pemahaman yang bernuansa tentang isyarat visual global dan lokal. Model Tradisional Model tradisional seperti Jaringan Saraf Konvolusional (CNN) dan Transformator Visi telah membuat kemajuan yang signifikan. Namun, mereka sering kali perlu bekerja secara efektif untuk menyeimbangkan konten lokal yang detail dengan konteks gambar yang lebih luas, aspek penting untuk tugas yang membutuhkan diskriminasi visual yang halus. LocalMamba Peneliti dari SenseTime Research, Universitas Sydney, dan Universitas Sains dan Teknologi Tiongkok memperkenalkan LocalMamba, yang dirancang untuk menyempurnakan pemrosesan data visual. Dengan mengadopsi strategi pemindaian unik yang membagi gambar menjadi jendela berbeda, LocalMamba memungkinkan pemeriksaan detail lokal yang lebih terfokus

  • Munculnya Grok-1: Sebuah Lompatan Kemajuan dalam Aksesibilitas AI

    Arsitektur Grok-1 Grok-1 dibangun dengan arsitektur Mixture-of-Experts (MoE), yang menggabungkan kecerdasan dari berbagai model dengan keahlian unik. Dengan 314 miliar parameter, Grok-1 menjadi salah satu model bahasa terbesar yang pernah dibuat. Tidak seperti model tradisional yang menggunakan semua parameter untuk setiap tugas, Grok-1 hanya mengaktifkan 25% bobotnya untuk token tertentu, sehingga memastikan efisiensi dan kelincahan yang tak tertandingi dalam memproses data dalam jumlah besar. Proses Pembuatan Grok-1 Grok-1 dilatih dari awal oleh xAI menggunakan tumpukan pelatihan khusus yang dibangun di atas JAX dan Rust. Proses pelatihan yang ketat ini tidak hanya membentuk kemampuan Grok-1 tetapi juga menetapkan tolok ukur baru untuk pengembangan AI. Etos Sains Terbuka xAI telah merilis bobot dan arsitektur Grok-1 di bawah lisensi Apache 2.0, menunjukkan komitmen mendalam terhadap sains terbuka. Keputusan ini membuka jalan bagi peneliti, pengembang, dan pengusaha di seluruh dunia untuk mengeksplorasi, men

  • Erez Dagan, Pelopor Kendaraan Otonom, Bergabung dengan Wayve sebagai Presiden Perusahaan

    Pengalaman Erez Dagan Erez Dagan, seorang tokoh terkemuka di industri, telah bergabung dengan Wayve sebagai Presiden. Selama 20 tahun berkarir di Mobileye, Erez berkontribusi signifikan dalam pengembangan sistem bantuan pengemudi tingkat lanjut (ADAS) dan teknologi kendaraan otonom (AD). Dengan keahliannya dalam Visi Komputer, Erez menduduki posisi kepemimpinan utama, termasuk Wakil Presiden Eksekutif Produk dan Strategi serta Wakil Presiden Intel Global. Selama masa jabatannya, ia memimpin portofolio dan strategi produk perusahaan, mendorong penerapan ADAS di lebih dari 120 juta kendaraan, merintis solusi L2+ dengan mitra otomotif, dan menskalakan arsitektur ini untuk meletakkan dasar bagi unit bisnis mobilitas-sebagai-layanan L4. Diakui sebagai pelopor di bidangnya, Erez adalah bagian dari tim yang meluncurkan produk ADAS berbasis kamera pertama, yang membuka jalan bagi sistem teknologi otomotif masa kini. Ia sekarang bergabung dengan Wayve untuk memimpin pengenalan produk Embodied AI pertama mereka untuk k

  • Osaka Protocol: Penerus Spiritual Shiba Inu Meluncurkan Proyek NFT Terdesentralisasi

    Pertumbuhan Pesat Osaka Protocol Osaka Protocol telah melampaui 20.000 pemegang di 7 jaringan blockchain. Kultus Black Shiba terus berkembang. Visi Pendiri Misterius Mephisto Seperti Shiba Inu, Osaka Protocol didirikan oleh sosok misterius bernama Mephisto. Mephisto ingin melanjutkan warisan Ryoshi, pendiri Shiba Inu, dan membangun komunitas yang benar-benar terdesentralisasi. Desentralisasi dan Tanggung Jawab Bersama Dalam komunitas Osaka Protocol, setiap anggota baru disebut sebagai “dev” (pengembang), istilah yang biasanya hanya digunakan untuk pendiri atau tim proyek. Mephisto menekankan bahwa setiap pemegang memiliki tanggung jawab atas kesuksesan proyek, sebanding dengan jumlah koin yang mereka miliki. Pencapaian Osaka Protocol Sikap memberdayakan ini telah menghasilkan pertumbuhan yang pesat, dengan ribuan “dev” membangun aset Osaka di seluruh dunia, termasuk: Jembatan multi-rantai yang memungkinkan Osaka diperdagangkan di Ethereum, Avalanche, BNB Smart Chain, Arbitrum, Polygon, Optimism, dan Base Acar

  • AQLM: Algoritma Pembelajaran Mesin untuk Kompresi Ekstrem Model Bahasa Besar Menggunakan Kuantisasi Aditif

    Pendahuluan Kemajuan pesat dalam kecerdasan buatan telah membawa tantangan teknis yang signifikan dalam mengoperasikan model bahasa besar (LLM) secara efisien pada perangkat keras konsumen. Tantangan ini muncul dari pertukaran inheren antara ukuran model dan efisiensi komputasi. Metode kompresi, termasuk kuantisasi langsung dan multi-codebook (MCQ), telah menawarkan solusi parsial untuk meminimalkan kebutuhan memori raksasa AI ini. Namun, pendekatan ini sering kali mengorbankan kinerja model, sehingga diperlukan inovasi dalam teknik kompresi model ekstrem. AQLM: Kuantisasi Aditif untuk Model Bahasa Strategi perintis yang disebut Kuantisasi Aditif untuk Model Bahasa (AQLM) oleh para peneliti dari HSE University, Yandex Research, Skoltech, IST Austria, dan NeuralMagic berfokus pada meminimalkan target pertukaran ini dengan mengurangi jumlah bit per parameter model ke kisaran yang sangat rendah, yaitu 2 hingga 3 bit. Strategi ini mengadopsi dan menyempurnakan kuantisasi aditif, sebuah teknik yang sebelumnya terb

  • Panduan Menggunakan ChatGPT: Langkah Demi Langkah

    Akses ChatGPT Kunjungi situs web OpenAI atau platform yang menyediakan ChatGPT. Buat akun dengan alamat email dan kata sandi. Memahami Antarmuka Biasanya terdapat kotak teks untuk mengetik pertanyaan atau perintah. Ada tombol “Kirim” untuk mengirimkan pertanyaan ke ChatGPT. Membuat Perintah Bersikaplah jelas dan spesifik dalam mengajukan pertanyaan. Berikan konteks dan detail yang cukup untuk permintaan konten kreatif. Berinteraksi dengan ChatGPT ChatGPT akan memberikan respons dalam beberapa detik. Baca respons dengan cermat untuk mendapatkan informasi yang dibutuhkan. Memperbaiki Pertanyaan Jika respons tidak sesuai harapan, perbaiki pertanyaan. Berikan konteks tambahan, ajukan pertanyaan lanjutan, atau ubah kata-kata. Fitur Lanjutan Sesuaikan nada respons, tingkat kreativitas, atau jumlah detail. Bereksperimenlah dengan pengaturan ini untuk menyesuaikan respons dengan preferensi. Batasan Pengetahuan ChatGPT terbatas pada informasi yang tersedia hingga titik waktu tertentu. ChatGPT dapat menghasilkan respon

  • Masa Depan Kognitif AI: Peneliti KAIST Ciptakan Model MoAI, Manfaatkan Wawasan Visi Komputer Eksternal untuk Menjembatani Kesenjangan Melihat dan Memahami

    Persimpangan Pemahaman Bahasa dan Persepsi Visual AI Bidang persimpangan pemahaman bahasa dan persepsi visual AI merupakan bidang yang dinamis yang mendorong batas-batas interpretasi dan interaksi mesin. Tim peneliti dari Korea Advanced Institute of Science and Technology (KAIST) telah mengembangkan MoAI, sebuah kontribusi penting untuk bidang ini. Model MoAI: Menjembatani Kesenjangan Melihat dan Memahami MoAI menandai era baru dalam model bahasa dan visi besar dengan secara cerdik memanfaatkan informasi visual tambahan dari model visi komputer (CV) khusus. Pendekatan ini memungkinkan pemahaman data visual yang lebih bernuansa, menetapkan standar baru untuk menafsirkan adegan kompleks dan menjembatani kesenjangan antara pemahaman visual dan tekstual. Arsitektur Inovatif MoAI Arsitektur MoAI dibedakan oleh dua modul inovatif: MoAI-Compressor dan MoAI-Mixer. MoAI-Compressor memproses dan memadatkan keluaran dari model CV eksternal, mengubahnya menjadi format yang dapat digunakan secara efisien bersama fitur vis

  • Evaluasi Kemampuan Model AI dan Agen LLM dengan Vectorview

    Kemajuan dalam kecerdasan buatan (AI) menghasilkan pertumbuhan yang mengesankan. AI dengan cepat mengubah kehidupan dan karier kita, dari chatbot yang berkomunikasi dengan konsumen hingga algoritma yang menyarankan film berikutnya. Namun, kekuatan ini juga membawa tanggung jawab besar. Bahkan model AI paling canggih pun rentan terhadap bias, kelemahan keamanan, dan hasil yang tidak terduga. Vectorview: Startup AI untuk Pengembangan AI yang Etis Vectorview adalah startup keren yang mendukung pengembangan AI yang etis. Banyak bisnis ingin menggunakan AI, tetapi mereka tidak memiliki orang yang tepat untuk mempertimbangkan pro dan kontranya. Metode pengujian tradisional sering kali melewatkan seluk-beluk perilaku AI. Vectorview menyediakan platform evaluasi menyeluruh untuk mengatasi kesulitan ini. Pengujian yang Komprehensif Vectorview membangun pengaturan pengujian yang unik. Pendirinya, Emil Fröberg dan Lukas Petersson, adalah advokat keselamatan AI. Pengaturan ini memungkinkan pengujian menyeluruh model AI d

  • V3D: Metode Kecerdasan Buatan Baru untuk Menghasilkan Gambar Multi-Sudut yang Konsisten dengan Model Difusi Gambar-ke-Video

    Pengantar Dunia digital terus berkembang dengan pesat, dan pembuatan konten 3D merupakan salah satu bidang yang paling dinamis. Penting bagi banyak sektor seperti game, produksi film, dan realitas virtual, bidang ini telah mengalami perubahan transformatif dengan munculnya teknologi pembuatan 3D otomatis. Teknologi ini merevolusi cara kita memahami dan berinteraksi dengan lingkungan digital serta mendemokratisasi pembuatan konten 3D, sehingga dapat diakses oleh kreator dengan berbagai tingkat keahlian. Tantangan dalam Pembuatan Konten 3D Tantangan utama dalam memajukan pembuatan konten 3D adalah mencari metodologi yang dapat menghasilkan objek 3D yang detail dan kompleks dengan cepat. Meskipun efektif, teknik sebelumnya sering kali perlu ditingkatkan dalam menyeimbangkan detail dengan efisiensi waktu. Membuat model 3D dengan fidelitas tinggi adalah proses yang melelahkan yang membutuhkan sumber daya komputasi dan waktu yang besar, yang biasanya menghasilkan model yang, meskipun sudah diusahakan, masih memerlu

  • Eksplorasi Tambang Generasi – Menargetkan Tembaga dalam Program Eksplorasi Dua Fase Termasuk Pengeboran dan Kecerdasan Buatan

    Pendahuluan Generation Mining Limited mengumumkan bahwa mereka telah menandatangani kontrak dengan Boart Longyear Canada untuk melakukan pengeboran eksplorasi hingga 8.000 meter pada sejumlah target tembaga berprospek tinggi di utara dan barat Proyek Palladium-Tembaga Marathon di Ontario Barat Laut. Dua fase pengeboran serta sejumlah program lapangan telah direncanakan. Program Pengeboran Fase Musim Dingin: Berfokus pada prospek Biiwobik, yang terletak tepat di utara deposit Palladium-Tembaga Marathon. Fase Musim Panas: Meliputi target Four Dams dan Sally. Tujuan Pengeboran Menentukan potensi perluasan deposit Palladium-Tembaga Marathon atau mengembangkan tambang keempat untuk memperpanjang umur tambang hingga lebih dari 13,5 tahun. Menguji perpanjangan mineralisasi ke arah bawah dan sepanjang jurus untuk menentukan potensi prospek Biiwobik. Prospek Four Dams Memiliki pipa ultramafik selebar sekitar 250 meter dan tebal 60 meter yang mengandung mineral berdensitas tinggi seperti olivin dan apatit. Konsentrasi

  • MM1: Model Bahasa Besar Multimodal Apple dengan Performa Unggul

    Pendahuluan Penelitian terbaru berfokus pada pengembangan Model Bahasa Besar Multimodal (MLLM) canggih yang mengintegrasikan kompleksitas data visual dan tekstual dengan mulus. Dengan meneliti secara mendalam desain arsitektur, pemilihan data, dan transparansi metodologi, penelitian ini telah mendorong batas kemampuan MLLM dan mendukung eksplorasi di masa mendatang. Pengembangan MM1 Peneliti di Apple mengembangkan MM1, sebuah keluarga model multimodal mutakhir dengan parameter hingga 30 miliar. Mereka mengambil pendekatan keterbukaan dan dokumentasi terperinci yang berbeda, memberikan wawasan berharga tentang konstruksi MLLM. Dokumentasi teliti mereka mencakup segala hal mulai dari pilihan pengode gambar hingga kerumitan menghubungkan data visual dengan elemen linguistik, menawarkan peta jalan yang jelas untuk membangun model yang lebih efektif dan transparan. Pemilihan Data Pra-Pelatihan Salah satu pengungkapan utama studi ini adalah dampak signifikan dari data pra-pelatihan yang dipilih dengan cermat terhad

  • Reranker: Pustaka Python Ringan untuk Menyediakan Cara Terpadu Menggunakan Berbagai Metode Reranking

    Dalam dunia pencarian informasi, salah satu tantangan umum adalah reranking dokumen. Ini adalah teknik yang ampuh tetapi bisa menakutkan bagi mereka yang tidak terbiasa dengannya. Mencoba pendekatan reranking baru sering kali berarti mengerjakan ulang seluruh alur kerja Anda, meskipun tujuannya tetap sama. Kompleksitas ini dapat menghambat eksperimen dan inovasi di lapangan. Solusi yang ada untuk masalah ini terbatas. Banyak metode reranking diimplementasikan di pustaka terpisah dengan kekhasan dan dependensi. Lanskap yang terfragmentasi ini menyulitkan pengguna untuk mengintegrasikan model reranking yang berbeda ke dalam alur kerja mereka dengan mulus. Perkenalkan Reranker Reranker adalah pustaka ringan yang dirancang untuk mengatasi tantangan ini. Dengan reranker, pengguna dapat dengan mudah memasukkan berbagai metode reranking ke dalam alur kerja mereka menggunakan API terpadu. Pustaka ini bertujuan untuk menyederhanakan proses mencoba model reranking yang berbeda, memberdayakan pengguna untuk bereksperime

  • FAX: Perpustakaan Python Berbasis JAX untuk Mendefinisikan Komputasi Terdistribusi dan Terfederasi yang Dapat Diskalakan di Pusat Data

    Pendahuluan FAX adalah perpustakaan perangkat lunak canggih yang dibangun di atas JavaScript untuk meningkatkan komputasi yang digunakan dalam pembelajaran terfederasi (FL). Ini dirancang khusus untuk memfasilitasi komputasi terdistribusi dan terfederasi berskala besar di berbagai aplikasi, termasuk pusat data dan situasi lintas perangkat. Fitur FAX Integrasi dengan JAX: FAX memanfaatkan fitur sharding JAX untuk integrasi yang mulus dengan TPU (Unit Pemrosesan Tensor) dan runtime JAX yang canggih seperti Pathways. Bangunan Dasar Terintegrasi: FAX menyediakan blok bangunan penting untuk komputasi terfederasi sebagai primitif di dalam JAX, yang memberikan skalabilitas, kompilasi JIT yang sederhana, dan fitur AD. Komputasi Terfederasi: Dalam FL, klien bekerja sama dalam tugas Pembelajaran Mesin (ML) tanpa mengungkapkan informasi pribadi mereka. Komputasi terfederasi sering kali melibatkan beberapa model pelatihan klien secara bersamaan sambil mempertahankan sinkronisasi berkala. Dukungan Pusat Data: Meskipun kli

  • Peningkatan Kecerdasan Sosial pada Agen Bahasa melalui Interaksi dan Imitasi

    Pengantar Dalam kecerdasan buatan, pengembangan agen bahasa yang mampu menavigasi dinamika sosial manusia yang rumit menjadi bidang yang menonjol. Berbeda dengan pendahulunya, agen canggih ini ditugaskan untuk memahami hal-hal yang rumit seperti nuansa budaya, ekspresi emosional, dan norma sosial yang tidak diucapkan. Tujuan utamanya adalah menciptakan entitas yang dapat berinteraksi dengan manusia secara teknis akurat, mahir secara sosial, dan beresonansi secara emosional. Tantangan dalam Kecerdasan Sosial Interaksi sosial manusia sangatlah kompleks, diatur oleh kode etik tidak tertulis yang bahkan dipelajari manusia selama bertahun-tahun sosialisasi. Meskipun mahir dalam mengurai dan menghasilkan bahasa, model tradisional sering kali kesulitan menafsirkan maksud di balik kata-kata atau merespons sesuai dengan ekspektasi sosial. Interaksi mereka dapat terasa kaku, tidak memiliki kelancaran dan kemampuan beradaptasi dari percakapan manusia yang sebenarnya. SOTOPIA-π: Pendekatan Interaktif Penelitian untuk kec

  • Cognition Labs: Memimpin Revolusi Perangkat Lunak AI

    Devin: Insinyur Perangkat Lunak AI yang Berkode Seperti Manusia Pengembangan Berbasis Prompt: Devin memungkinkan Anda membangun fondasi aplikasi atau situs web tanpa pengetahuan pengkodean yang mendalam. Pembuatan End-to-End: Devin menangani seluruh siklus pengembangan, dari pengkodean hingga penerapan. Debugging dan Penyempurnaan: Devin dapat mengidentifikasi kesalahan, mengusulkan perbaikan, dan terus meningkatkan kodenya sendiri. Pembelajaran Berkelanjutan: Devin dapat beradaptasi dan mempelajari kerangka kerja pemrograman baru dengan cepat. Keberhasilan di Dunia Nyata: Devin telah menunjukkan kehebatannya di Upwork, menyelesaikan proyek perangkat lunak lepas dengan kepuasan pelanggan yang tinggi. Dampak Potensial Devin pada Pengembangan Perangkat Lunak Menyederhanakan Pekerjaan Rutin: Devin mengotomatiskan aspek pengkodean yang berulang dan memakan waktu. Mempercepat Siklus Pengembangan: Dengan Devin menangani tugas pengkodean rutin, garis waktu pengembangan dapat dipersingkat secara signifikan. Menurunka

  • Trace3 Memilih Platform Penawaran Provus untuk Mengoptimalkan Penawaran dan Meningkatkan Keterlibatan Pelanggan

    Pengoptimalan Penawaran Trace3 dengan Solusi Berbasis AI dari Provus Dalam upaya seluruh perusahaan yang berfokus pada pemanfaatan teknologi untuk efisiensi yang lebih besar dan meningkatkan pengalaman pelanggan, Trace3 mengidentifikasi proses penawaran mereka sebagai area penting untuk peningkatan. Mengingat proses pra-penjualan untuk Layanan memerlukan beberapa kontributor utama yang berkolaborasi untuk merumuskan solusi bagi pelanggan mereka, diidentifikasi bahwa proses penawaran dapat menjadi jauh lebih efisien dan meningkatkan kecepatan ke pasar bagi pelanggan. “Kami mencari solusi yang dapat menyederhanakan proses penawaran kami, mengurangi waktu penyelesaian, dan membebaskan tim kami sehingga kami dapat fokus pada keterlibatan klien,” kata Mallory Woods, VP Pengalaman Klien di Trace3. “Platform berbasis AI Provus muncul sebagai pilihan yang jelas dengan kemampuannya untuk mengotomatiskan proses dan memungkinkan keputusan yang akurat dan berbasis data dalam skala yang dapat kami gunakan untuk meningkatk

  • API Finansial Berbasis AI dari Bloxcross untuk Pembayaran

    Pendahuluan Bloxcross, penyedia solusi pembayaran terkemuka, merevolusi pembayaran global dengan memperkenalkan API infrastruktur finansial bertenaga AI yang canggih. Melalui aliansi perbankan strategis dan infrastruktur aset digital, Bloxcross mendorong inovasi dalam ekonomi digital, menyediakan transaksi finansial yang mulus di seluruh dunia. Dengan kehadiran yang kuat di Kolombia, Meksiko, Brasil, Hong Kong, dan Singapura, Bloxcross berada di garis depan dalam mentransformasi metode pembayaran global tradisional. Solusi canggih mereka siap untuk mendefinisikan ulang lanskap pembayaran, menawarkan efisiensi, keamanan, dan kecepatan yang tak tertandingi kepada klien. Konversi Kecerdasan Adaptif Kunci kesuksesan Bloxcross adalah teknologinya yang dipatenkan, Adaptive Intelligence Conversion (AIC). Didukung oleh kecerdasan buatan, AIC memberikan wawasan instan dan strategi konversi mata uang yang optimal secara real-time, memberdayakan bisnis untuk membuat keputusan yang tepat dengan cepat. Teknologi revolusio

  • Perubahan Kepemimpinan Under Armour

    Perubahan Kepemimpinan Kevin Plank akan menjadi Presiden & CEO, sementara Mohamed A. El-Erian, Direktur Utama Under Armour, ditunjuk sebagai Ketua Dewan. Peran Baru Plank Plank, yang sebelumnya menjabat sebagai Ketua Eksekutif Dewan, akan tetap menjadi direktur. Dia akan fokus pada inovasi produk dan merek. Peran Baru Linnartz Linnartz akan tetap menjadi penasihat perusahaan hingga 30 April 2024. Dia telah memperkuat tim kepemimpinan dan fokus pada strategi konsumen. Komentar Plank Plank berterima kasih kepada Linnartz atas kontribusinya dan menyatakan bahwa Under Armour sedang berupaya memperkuat kekuatannya dan membuat keputusan bisnis yang seimbang untuk mendorong kesuksesan jangka panjang. Komentar Linnartz Linnartz bangga dengan kemajuan yang dicapai di bawah kepemimpinannya dan yakin bahwa Under Armour memiliki potensi tak terbatas. Komentar El-Erian El-Erian berterima kasih kepada Linnartz atas kontribusinya dan menyatakan bahwa dia menantikan kerja sama dengan Plank untuk membuka nilai pemegang saham

  • COULER: Sistem AI untuk Optimalisasi Alur Kerja Pembelajaran Mesin Terpadu di Cloud

    Pendahuluan Alur kerja pembelajaran mesin (ML), yang penting untuk mendorong inovasi berbasis data, telah berkembang dalam kompleksitas dan skala, menantang metode optimalisasi sebelumnya. Alur kerja ini, yang merupakan bagian integral dari berbagai organisasi, membutuhkan sumber daya dan waktu yang besar, meningkatkan biaya operasional saat mereka berkembang untuk mengakomodasi infrastruktur data yang beragam. Mengatur alur kerja ini melibatkan navigasi melalui berbagai mesin alur kerja yang berbeda, masing-masing dengan Antarmuka Pemrograman Aplikasi (API) yang unik, sehingga mempersulit proses optimalisasi di berbagai platform. Skenario ini memerlukan pergeseran ke pendekatan yang lebih terpadu dan efisien untuk manajemen alur kerja ML. COULER: Pendekatan Terpadu untuk Manajemen Alur Kerja ML Sebuah tim peneliti dari Ant Group, Red Hat, Snap Inc., dan Sichuan University mengembangkan COULER, sebuah pendekatan baru untuk manajemen alur kerja ML di cloud. Sistem ini melampaui keterbatasan solusi yang ada den

  • Rangkuman AI Harian: Pembaruan Terbesar Pembelajaran Mesin, Robotika, dan Otomatisasi

    Klleon Mengungkap Teknologi Manusia Digital Revolusioner di NVIDIA GTC 2024 Klleon, pelopor teknologi manusia digital, siap mengungkap inovasi terobosan terbarunya di konferensi NVIDIA GTC 2024, yang dijadwalkan pada 18-21 Maret 2024. Inisiatif perintis ini merupakan buah dari kolaborasi selama lebih dari dua tahun dengan NVIDIA, menandai tonggak penting dalam pengembangan manusia digital yang mampu menunjukkan berbagai ekspresi emosi seperti manusia. Selector Menggabungkan AI Generatif dan Kemampuan Pemantauan Asli untuk Mengubah Operasi TI Selector AI, penyedia terkemuka AIOps yang sadar jaringan, pengamatan, dan analitik multi-domain, mengumumkan rilis Musim Semi 2024. Inovasi termasuk LLM berorientasi jaringan yang didukung GenAI, kemampuan pemantauan tumpukan penuh asli, dan korelasi peristiwa dengan analisis akar penyebab. Draganfly Mengintegrasikan Drone dengan Robot & Sistem Keamanan Otonom Knightscope Draganfly Inc., pengembang solusi dan sistem drone terkemuka di industri, dan Knightscope, Inc., ino

  • Moderator Komentar Media Sosial AI Pertama untuk Industri Ilmu Hayati Diluncurkan Klick Health

    Peningkatan Penanganan Farmakovigilans Klick Health meluncurkan Klick Comment Moderator+AI (KCM+AI), moderator komentar media sosial pertama untuk industri ilmu hayati yang didukung kecerdasan buatan. KCM+AI ditenagai oleh Microsoft Azure AI dan model Klick eksklusif yang dilatih pada hampir 400.000 komentar historis untuk meningkatkan deteksi dan pelaporan farmakovigilans (PV) serta membuat manajemen komunitas lebih efisien dan interaktif. Perlindungan Merek yang Ditingkatkan Peluncuran KCM+AI menandai generasi berikutnya dari Klick Comment Moderator (KCM), yang diperkenalkan pada tahun 2015 untuk memberikan keamanan merek dalam industri yang sangat diatur dengan menahan komentar media sosial untuk ditinjau. Selama hampir satu dekade, KCM telah menjaga keamanan klien di banyak bidang terapi, termasuk imunologi dan neurologi. KCM digunakan dalam inisiatif media sosial Lighter Blue yang memenangkan penghargaan, yang memiliki lebih dari satu juta pengikut Facebook dan 10 juta keterlibatan, dan membuka dialog te

  • ElsieAI: Merevolusi Analisis Data Percakapan untuk Tim Urusan Medis

    Pengantar Kwello, divisi dari Acceleration Point dan penyedia solusi wawasan inovatif terkemuka untuk tim Urusan Medis, dengan bangga memperkenalkan ElsieAI. Solusi inovatif ini dirancang untuk mengatasi tantangan unik yang dihadapi oleh tim Urusan Medis. Fitur Utama ElsieAI Teknologi AI yang Canggih: ElsieAI memanfaatkan kekuatan Kecerdasan Buatan Generatif untuk mengekstrak wawasan berharga dari data wawasan yang kompleks. Antarmuka Ramah Pengguna: Pengguna dapat berinteraksi dengan data wawasan internal mereka menggunakan bahasa sehari-hari, sehingga mudah untuk mengungkap tren, ringkasan, dan tindakan terbaik berikutnya. Pelatihan Medis Khusus: ElsieAI dilatih secara medis untuk menavigasi informasi ilmiah yang rumit, memberikan tim Urusan Medis langkah-langkah yang dapat ditindaklanjuti dan interpretasi yang jelas dari data wawasan yang kompleks. Manfaat ElsieAI Analisis Data yang Mudah: Pengguna dapat mengajukan pertanyaan dan menerima tanggapan terperinci dalam bahasa sehari-hari, menghilangkan kesulit

  • Data Lakehouse Copilot Bertenaga AI dari Rimes untuk Wawasan Bahasa Alami

    Rimes dengan bangga mengumumkan peluncuran Data Lakehouse Copilot. Model Bahasa Besar (LLM) yang didukung oleh AI Copilot dengan cepat memberikan wawasan unik dari data menggunakan bahasa alami. Fokus awal AI Copilot adalah untuk memunculkan wawasan dari data ETF, data ESG sumber terbuka, serta data demo dari mitra data. Wawasan yang Didukung AI Theo Bell, Kepala Pengembangan Produk AI di Rimes, berkomentar, “Lakehouse Copilot memanfaatkan model AI terbaik di kelasnya untuk pembuatan kueri data dan digunakan dengan aman di Data Lakehouse klien. Kekuatan AI sangat besar; misalnya, menambahkan metadata ke model data standar lebih mendukung alur kerja pengguna akhir melalui kueri bahasa alami. Lakehouse Copilot kami lebih lanjut mendukung skenario ‘bawa data Anda sendiri’, yang memungkinkan klien untuk menerapkan AI ke data perusahaan mereka yang ditautkan dengan data yang disediakan oleh Rimes. Dengan memanfaatkan Data Lakehouse, kami dapat membantu klien mempercepat adopsi AI mereka tanpa memerlukan keterampil

  • Pelatihan Model Besar 100B yang Efisien dengan Biaya Rendah pada Server Kelas Bawah

    Pendahuluan Model bahasa besar (LLM) telah merevolusi pemrosesan bahasa alami, menunjukkan kemampuan luar biasa karena jumlah parameternya yang sangat besar. Model-model ini, yang dicontohkan oleh model transformator padat yang transformatif, tidak hanya memecahkan rekor akurasi tetapi juga menjadi aset penting dalam tugas manajemen data. Ukuran model model transformator padat baru-baru ini telah berkembang dari 1,5B (GPT-2) menjadi 540B (PaLM), menunjukkan evolusi model-model ini dalam perjalanan yang belum pernah terjadi sebelumnya ke dalam ranah penguasaan linguistik. Tantangan Pelatihan Model Besar Meskipun potensi LLM tidak dapat disangkal, tantangan kritis muncul dari ukuran parameternya yang sangat besar yang membanjiri bahkan GPU paling kuat, yang saat ini mencapai puncaknya pada memori 80GB. Saat melakukan optimasi berbasis gradien turun stokastik, mereka harus lebih memadai untuk mengakomodasi parameter yang sangat besar ini dan status pengoptimal yang terkait. Untuk meng-host model yang sangat besa

  • Ragas: Kerangka Pembelajaran Mesin Berbasis Python untuk Mengevaluasi Pipeline Retrieval Augmented Generation (RAG)

    Pengantar Retrieval Augmented Generation (RAG) adalah teknik canggih dalam model bahasa yang meningkatkan pemahaman model bahasa dengan mengambil informasi yang relevan dari sumber data eksternal. Namun, tantangan signifikan muncul saat pengembang mencoba menilai kinerja sistem RAG mereka. Dengan cara yang mudah untuk mengukur efektivitas, akan lebih mudah untuk mengetahui apakah data eksternal benar-benar menguntungkan model bahasa atau mempersulit responsnya. Kebutuhan Evaluasi RAG Ada alat dan kerangka kerja yang dirancang untuk membangun pipeline RAG tingkat lanjut ini, memungkinkan integrasi data eksternal ke dalam model bahasa. Sumber daya ini sangat berharga bagi pengembang yang ingin meningkatkan sistem mereka tetapi harus mengejar ketertinggalan dalam evaluasi. Ketika ditambah dengan data eksternal, menentukan kualitas keluaran model bahasa menjadi lebih kompleks. Alat yang ada saat ini terutama berfokus pada pengaturan dan aspek operasional sistem RAG, meninggalkan celah dalam fase evaluasi. Ragas:

  • Motion Mamba: Kerangka Kerja Pembelajaran Mesin Baru untuk Pembuatan Gerakan Berurutan yang Efisien dan Luas

    Pengantar Mereplikasi gerakan manusia secara digital telah lama memikat para peneliti, mencakup aplikasi dari video game dan animasi hingga robotika. Upaya ini menuntut pemahaman yang rumit tentang nuansa yang menentukan gerakan manusia, menantang para ilmuwan untuk merancang model yang dapat meniru dan memprediksi perilaku kompleks dengan presisi. Batasan Pendekatan yang Ada Meskipun terobosan pada masanya, pendekatan yang ada sering kali bergulat dengan keterbatasan yang disebabkan oleh kompleksitas komputasi dan ketidakmampuan untuk menangkap kelancaran gerakan manusia pada urutan yang diperpanjang secara akurat. Model Ruang Keadaan (SSM) Kemajuan terbaru termasuk mengeksplorasi model ruang keadaan (SSM), yang telah digembar-gemborkan untuk prediksi gerakan secara signifikan. Model-model ini, khususnya varian Mamba, telah menunjukkan janji dalam mengelola urutan panjang secara lebih efektif daripada pendahulunya tanpa beban tuntutan komputasi yang berlebihan. Tantangan dalam Pembuatan Gerakan Namun, penera

  • Metode Pembelajaran Mesin Baru untuk Abstraksi Aksi Temporal Multitugas

    Sejak awal, robotika telah membuat kemajuan yang signifikan, dengan robot yang banyak digunakan saat ini di berbagai industri, seperti pemantauan rumah dan elektronik, nanoteknologi, kedirgantaraan, dan banyak lainnya. Robot ini mampu memproses data kompleks berdimensi tinggi dan memutuskan tindakan terbaik yang harus diambil. Mereka melakukannya dengan membangun abstraksi, yaitu ringkasan padat dari apa yang mereka lihat dan tindakan apa yang dapat mereka ambil, yang membantu mereka menggeneralisasi di seluruh tugas. Para peneliti terutama berkonsentrasi pada pembelajaran abstraksi atau ringkasan ini dari data daripada membuatnya secara manual. Dalam penelitian dari Microsoft ini, tim peneliti berfokus pada abstraksi aksi temporal, yaitu memecah kebijakan kompleks menjadi tugas tingkat rendah seperti mengambil benda, berjalan, dll. Mereka percaya bahwa teknik ini memiliki potensi besar untuk pembelajaran representasi aksi. Mereka telah memperkenalkan metode baru yang disebut Primitive Sequence Encoding (PRIS

  • Kreativitas Digital yang Diperkaya dengan Pembuatan Gambar Berbasis Subjek

    Kemampuan membuat gambar dari deskripsi tekstual telah menandai lompatan transformatif, mendorong kita ke era di mana kreativitas berpotongan dengan teknologi dengan cara yang belum pernah terjadi sebelumnya. Di antara kemajuan ini, pembuatan gambar berbasis subjek adalah ranah yang sangat menarik. Teknik ini memungkinkan pembuatan gambar yang sangat dipersonalisasi dari subjek tertentu, seperti hewan peliharaan kesayangan atau benda kesayangan, dari sejumlah contoh minimal. Tantangan dalam Pembuatan Gambar Berbasis Subjek Tantangan yang terus-menerus dalam bidang ini adalah ketidakmampuan untuk sepenuhnya menangkap dan mengekspresikan atribut terperinci yang mendefinisikan subjek dalam kategori yang lebih luas. Keterbatasan ini sering kali menghasilkan gambar yang dihasilkan yang, meskipun menyerupai subjek, kehilangan esensi karakteristik yang ditentukan oleh kategori, yang mengarah pada representasi yang terasa agak kosong dan kurang kehidupan. Regularisasi Berbasis Subjek (SuDe) Para peneliti dari Univers

  • Kronos: Kerangka Kerja Pembelajaran Mesin Baru untuk Model Deret Waktu Probabilistik Terlatih

    Pendahuluan Alat peramalan yang akurat sangat penting dalam industri seperti ritel, keuangan, dan perawatan kesehatan, dan alat-alat ini terus berkembang menuju kecanggihan dan aksesibilitas yang lebih besar. Secara tradisional berlabuh pada model statistik seperti ARIMA, domain ini telah menyaksikan pergeseran paradigma dengan munculnya pembelajaran mendalam. Teknik modern ini telah membuka kemampuan untuk menguraikan pola kompleks dari kumpulan data yang banyak dan beragam, meskipun dengan mengorbankan peningkatan permintaan komputasi dan keahlian. Kronos: Kerangka Kerja Inovatif Sebuah tim dari Amazon Web Services, bekerja sama dengan UC San Diego, University of Freiburg, dan Amazon Supply Chain Optimization Technologies, memperkenalkan kerangka kerja revolusioner yang disebut Kronos. Alat inovatif ini mendefinisikan ulang peramalan deret waktu dengan menggabungkan analisis data numerik dengan pemrosesan bahasa, memanfaatkan kekuatan model bahasa berbasis transformator. Dengan menyederhanakan jalur peramal

  • Ringkasan AI Harian: Pembaruan Terbesar Machine Learning, Robotik, dan Otomatisasi

    SnapLogic Menutup Tahun yang Sukses Saat Perusahaan Berlomba Memanfaatkan Kekuatan Integrasi Generatif SnapLogic, pemimpin dalam integrasi generatif, mengumumkan momentum perusahaan yang signifikan yang didorong oleh inovasi produk, ekspansi pelanggan dan mitra, serta pengakuan industri di tengah meningkatnya adopsi teknologi integrasi generatif yang kuat, yang telah terbukti menjadi komponen penting dalam memodernisasi infrastruktur lama untuk perusahaan. Zendesk Akan Mengakuisisi Ultimate Zendesk mengumumkan akan mengakuisisi Ultimate, penyedia otomatisasi layanan terkemuka di industri, untuk memberikan penawaran AI paling lengkap untuk pengalaman pelanggan (CX) di pasar. Karena permintaan AI yang belum pernah terjadi sebelumnya mendorong kecepatan dan frekuensi keterlibatan pelanggan, agen AI melampaui kemampuan bot tradisional untuk membantu merek mengubah CX menjadi keunggulan kompetitif. Oracle Membantu Organisasi Mengelola Inisiatif Keberlanjutan Secara Efektif Oracle CloudWorld Oracle mengumumkan Orac

  • Optimalisasi Insentif AI Real-Time untuk E-commerce

    Pengantar Session AI, pelopor pemasaran dalam sesi, telah mengumumkan AI Incentive Optimization, solusi AI real-time untuk pengecer e-commerce untuk mencapai tujuan komersial. AI Incentive Optimization adalah teknologi pertama yang secara mandiri menyebarkan, menguji, dan mengelola insentif di tempat secara real-time, tanpa menggunakan data pribadi konsumen. Platform Pemasaran Dalam Sesi AI Incentive Optimization memperluas platform pemasaran dalam sesi Session AI untuk pelanggan yang telah menerapkannya sepenuhnya. Platform pemasaran dalam sesi memprediksi niat pembelian untuk setiap pengunjung situs hanya berdasarkan perilaku mereka, kemudian dapat memberikan insentif langsung kepada mereka yang membutuhkannya untuk melakukan konversi. Platform ini juga dapat menekan penawaran untuk pengunjung dengan niat tinggi untuk meningkatkan margin. Pemasaran dalam sesi memberikan hasil yang signifikan dibandingkan dengan teknologi non-AI karena model AI berjalan dan pengecer mengambil tindakan saat pengunjung masih b

  • Desain Material Canggih dengan Platform MateriAI Berbasis AI

    NEC Laboratories Europe dan NEC Laboratories America telah mengembangkan MateriAI, platform desain material berbasis AI yang mempercepat pengembangan material baru yang ramah lingkungan. Prototipe platform ini awalnya dirancang untuk mengatasi hambatan besar dalam pembuatan polimer sintetis, organik, dan biobased baru, seperti karet dan plastik. Proses yang Dipercepat dan Semi-Otomatis Koichi Funaya, Kepala Arsitek Teknologi di NEC Laboratories Europe, menjelaskan: “Untuk mengembangkan material baru, para ilmuwan harus terlebih dahulu menavigasi sejumlah besar informasi yang ada tentang material terkait dan kemudian membuat daftar singkat struktur molekul baru yang potensial untuk pengembangan material baru. MateriAI mengubah proses ini dengan membuatnya jauh lebih cepat, semi-otomatis pengumpulan data, sekaligus menggunakan AI untuk menyarankan polimer baru untuk desain material.” Model Bahasa yang Luas dan Pembelajaran Mesin yang Berbasis Fisika MateriAI menggunakan model bahasa besar berbasis polimer yang

  • Sistem Perdagangan AI Bitcoin Billionaire Diluncurkan untuk Spanyol

    Bitcoin Billionaire telah membawa inovasi ke tingkat berikutnya dengan sistem perdagangan AI yang dirancang khusus untuk Spanyol, menawarkan banyak keuntungan canggih bagi pelanggan di negara tersebut. Meskipun fokus pelopor di bidang ini tetap pada Spanyol, sistem ini juga dapat digunakan oleh pelanggan di negara-negara berbahasa Spanyol lainnya, termasuk Meksiko, Kolombia, Argentina, Kosta Rika, dan lainnya. Peluang Perdagangan yang Dinamis Mata uang kripto termasuk Bitcoin, menawarkan peluang dinamis bagi orang-orang di seluruh dunia untuk membangun kekayaan mereka dengan memperdagangkannya. Namun, mendapatkan akses yang tepat ke mata uang kripto tersebut tetap menjadi tantangan. Bitcoin Billionaire didirikan dengan tujuan mengubah hal itu, dan secara konsisten memenuhi misi tersebut tidak hanya dengan memfasilitasi akses tetapi juga dengan berbagi pengetahuan dan alat penting bagi pelanggan untuk berdagang dengan sukses di pasar. Inovasi yang Berkelanjutan Sejak awal, platform ini telah mendorong revolusi

  • Devin: Insinyur Perangkat Lunak AI Mandiri Pertama di Dunia

    Pengantar Kemajuan pesat dalam kecerdasan buatan (AI) telah menghasilkan penciptaan Devin oleh Cognition AI, insinyur perangkat lunak AI mandiri pertama di dunia. Kreasi unik ini menandai lompatan signifikan dalam rekayasa perangkat lunak, menetapkan tolok ukur baru dalam tolok ukur pengkodean SWE-Bench. Prestasi Devin Pencapaian Devin yang mengesankan meliputi: Lulus wawancara teknik praktis di perusahaan AI terkemuka Memenuhi peran pekerjaan aktual di Upwork Memecahkan tolok ukur pengkodean SWE-Bench Transformasi Rekayasa Perangkat Lunak Devin muncul sebagai solusi perintis, yang mewujudkan potensi penuh AI untuk mengatasi tantangan teknik yang kompleks secara mandiri. Alat yang ada dalam pemrograman yang dibantu AI telah menawarkan dukungan berharga dengan menyederhanakan aspek-aspek seperti penyelesaian kode dan identifikasi masalah. Namun, mereka membutuhkan pendekatan holistik untuk pengembangan perangkat lunak. Devin, dengan kemampuannya yang canggih, menjembatani kesenjangan ini. Fitur Devin Devin ber

  • Pemanfaatan Model Bahasa Besar (LLM) dalam Ilmu Material: Penggunaan LLM yang Cerdas oleh Imperial College London untuk Analisis Data dan Otomatisasi

    Pendahuluan Kemunculan model bahasa besar (LLM) telah memicu pergeseran mendalam dalam dinamika penelitian ilmiah. Transformasi ini paling mencolok di persimpangan kecerdasan buatan dan ilmu material, di mana kemampuan LLM, seperti GPT dan rekan-rekannya, melampaui sekadar pembuatan teks dan mencakup otomatisasi tugas dan ekstraksi pengetahuan. Kemampuan LLM Seperti yang dijelaskan dalam studi komprehensif oleh para peneliti dari Imperial College London, model-model ini menyederhanakan alur kerja dan mendemokratisasi proses penelitian, membuat analisis rumit lebih mudah didekati dan memicu rasa ingin tahu tentang potensinya. Inti dari LLM terletak pada algoritme canggih yang didukung oleh mekanisme perhatian dan transformator, memungkinkan mereka untuk mengurai dan menghasilkan teks seperti manusia. Landasan ini memfasilitasi penerapannya dalam berbagai tugas, mulai dari pembuatan kode hingga pemecahan masalah heuristik, yang menggarisbawahi keserbagunaannya. Aplikasi LLM dalam Ilmu Material Penelitian ini me

  • Serangan Pencurian Model AI Terobosan pada ChatGPT dan PaLM-2 Google

    Pendahuluan Model bahasa besar (LLM) canggih seperti GPT-4, Claude 2, atau Gemini dirahasiakan, dengan detail arsitektur, ukuran model, dan metode pelatihan yang disembunyikan dari publik. Kurangnya transparansi ini disebabkan oleh tekanan persaingan dan kekhawatiran tentang implikasi keamanan dari pengungkapan informasi yang dapat dieksploitasi untuk menyerang model-model ini. Serangan Pencurian Model Meskipun kerahasiaan seputar detail internal model, aksesibilitasnya melalui API menimbulkan pertanyaan tentang sejauh mana musuh dapat memperoleh informasi tentang model melalui kueri. Masalah ini termasuk dalam pencurian model, di mana musuh mencoba mengekstrak bobot model dengan menginterogasi API model. Serangan Proyeksi Penyelaman Para peneliti menyajikan pendekatan terobosan, serangan baru yang menargetkan model bahasa kotak hitam. Serangan ini, yang dirancang khusus untuk memulihkan lapisan proyeksi penanaman model bahasa transformator yang lengkap, berbeda dari pendekatan sebelumnya yang merekonstruksi

  • Kemajuan Algoritmik dalam Pra-Pelatihan Model Bahasa dari 2012 hingga 2023: Analisis Empiris Komprehensif

    Pengantar Model bahasa canggih telah merevolusi NLP, meningkatkan pemahaman mesin dan pembuatan bahasa manusia secara signifikan. Transformasi ini, yang telah dimainkan oleh para peneliti akademis dan profesional di bidang AI dan pembelajaran mesin, telah mendorong banyak aplikasi AI, dari peningkatan agen percakapan hingga mengotomatiskan tugas analisis teks yang kompleks. Tantangan Pelatihan Model Bahasa Inti dari kemajuan ini adalah tantangan melatih model secara efisien yang dapat menavigasi seluk-beluk bahasa manusia, sebuah tugas yang secara historis menuntut sumber daya komputasi yang signifikan karena pertumbuhan eksponensial dalam data dan kompleksitas model. Inovasi Arsitektur dan Algoritma Dalam mengatasi tantangan ini, komunitas telah menyaksikan pergeseran ke arah penyempurnaan arsitektur model dan pengoptimalan algoritma pelatihan. Sebuah terobosan penting adalah pengenalan arsitektur transformator, yang secara nyata meningkatkan efisiensi dan kinerja model bahasa bersamaan dengan peningkatan da

  • Platform Jaminan AI Gesund Berkembang dengan Trillium Health Partners

    Integrasi Data Berkualitas Tinggi Platform Jaminan AI Gesund dan para ahli mengintegrasikan data berkualitas tinggi THP untuk memberikan kesempatan unik untuk pengujian tekanan cepat pada model AI. Kemitraan Inovatif Gesund, perusahaan yang memastikan bahwa kecerdasan buatan (AI) medis aman, adil, dan efektif untuk semua, mengumumkan kemitraan inovatifnya dengan Institute for Better Health (IBH) di Trillium Health Partners (THP), sebuah sistem kesehatan terkemuka di Toronto. Untuk pertama kalinya, pengembang AI dapat menguji model AI mereka pada data dunia nyata IBH secara in situ dengan teknologi perintis Gesund.ai untuk memperoleh wawasan unik tentang kinerja model mereka dan area yang perlu ditingkatkan (bias, blindspot, dll.). Penilaian Berkelanjutan Awal tahun ini, Dr. Robert Carliff, Komisaris FDA, terkait dengan memastikan keamanan dan kesetaraan AI medis mengatakan: “Algoritme tidak hanya hidup, tetapi penilaian algoritme perlu berkelanjutan,” (…). Namun, “FDA tidak dapat melakukan ini sendirian. (…)

  • DAX Copilot Meningkatkan Pengalaman Pasien WellSpan Health

    Pengantar WellSpan Health meningkatkan pengalaman penyedia dan pasien berkualitas tinggi dengan menambahkan solusi Nuance Dragon Ambient eXperience (DAX™) Copilot ke penyebaran solusi inovatifnya yang ada untuk mengotomatiskan dan mempercepat pembuatan dokumentasi klinis selama kunjungan ruang pemeriksaan dan telehealth. Teknologi DAX Copilot DAX Copilot menggunakan teknologi AI percakapan, ambien, dan generatif yang telah terbukti untuk secara otomatis menyusun ringkasan klinis dari percakapan ruang pemeriksaan atau telehealth dalam hitungan detik untuk tinjauan langsung dan entri dalam sistem rekam medis elektronik (EHR). Hal ini memungkinkan dokter untuk terlibat dengan pasien dan anggota keluarga mereka secara penuh dan alami tanpa perlu mengetik catatan di komputer selama kunjungan. Integrasi Epic DAX Copilot, yang tertanam dalam Epic, merupakan satu-satunya solusi ambien yang tertanam sepenuhnya yang saat ini beroperasi dalam Epic, dengan lebih dari 55 organisasi layanan kesehatan. Jumlah ini akan berli

  • Pembaruan Harian AI: Pembaruan Pembelajaran Mesin, Robotika, dan Otomatisasi Terbesar

    Program Peningkatan HP untuk Mitra Pelatihan dan sertifikasi MasterClass AI berbasis peran pertama di industri Peluang Pertumbuhan Play baru, yang disesuaikan untuk Ilmu Data AI Union Bergabung dengan NVIDIA Inception Union bergabung dengan program NVIDIA Inception untuk mempercepat inovasi AI Berfokus pada pemberdayaan organisasi untuk membuat dan mengirimkan aplikasi bertenaga AI yang sangat andal SoftServe Menampilkan GenAI dan Adopsi Metaverse Industri di NVIDIA GTC 2024 Empat demo baru yang menunjukkan manfaat adopsi teknologi AI Generatif (Gen AI) dan metaverse industri KnowBe4 Memasukkan Agen AI Tingkat Lanjut untuk Meningkatkan Efisiensi dan Kecepatan Platform asli AI, Agen Pertahanan Kecerdasan Buatan (AIDA) Memungkinkan perubahan budaya jangka panjang dan pengurangan risiko manusia Quantexa Fokus pada Persiapan Data untuk AI di Perusahaan Roadmap Platform Kecerdasan Keputusan Quantexa Pembaruan tentang Q Assist, asisten kecerdasan buatan (AI) generatif

  • Union Bergabung dengan NVIDIA Inception untuk Mempercepat Inovasi AI

    Kolaborasi Menggarisbawahi Komitmen Union untuk Mendemokratisasi Pengembangan Aplikasi AI Union, perusahaan teknologi yang berfokus pada pemberdayaan organisasi untuk menciptakan dan memberikan aplikasi bertenaga AI yang sangat andal secara efisien, mengumumkan bahwa mereka telah bergabung dengan NVIDIA Inception, sebuah program yang membina perusahaan rintisan yang merevolusi industri dengan kemajuan teknologi. Platform Union Union berfokus pada pembangunan platform yang menyederhanakan dan mempercepat pengembangan, kolaborasi, dan penyebaran aplikasi AI. Memanfaatkan kekuatan platform orkestrasi alur kerja sumber terbukanya, Flyte, Union menyediakan lingkungan unik tempat ilmuwan data, insinyur ML, dan insinyur perangkat lunak dapat secara kolaboratif bereksperimen dan meningkatkan proyek data dan AI mereka dari prototipe lokal ke produksi pada infrastruktur terkelola. NVIDIA Inception Bergabung dengan NVIDIA Inception memungkinkan Union mengakses teknologi mutakhir NVIDIA dan memanfaatkan keahlian teknis,

  • KTT Ancaman Pemerintah CrowdStrike Menyatukan Pemimpin Sektor Publik dalam Keamanan Siber Masa Depan

    KTT Ancaman Pemerintah CrowdStrike mengumumkan jajaran pembicara tamu, pidato utama, dan sesi untuk acara keamanan siber sektor publik yang terkenal pada 19 Maret 2024 di Gedung Ronald Reagan, Washington D.C. Pemimpin dari seluruh sektor publik akan bergabung dengan CrowdStrike untuk membahas masa depan keamanan siber dan dampaknya pada keamanan nasional dan pemilu mendatang. “BAWAH TANAH MUSUH – EDISI PEMERINTAH: SISI GELAP AI & PROLIFERASI SIBER” Pembicara dan sesi meliputi: AI Generatif, Misinformasi, Disinformasi, dan Ancaman Siber untuk Pemilu 2024: Kepala Operasi Kontra Musuh CrowdStrike, Adam Meyers, akan menyoroti bagaimana kelompok kriminal, peretas, musuh negara-bangsa, dan perkembangan geopolitik memengaruhi lingkungan ancaman untuk pemilu global pada tahun 2024. Obrolan Santai dengan Shawn Henry dan Senator Mark R. Warner: Kepala Keamanan CrowdStrike dan mantan Asisten Direktur Eksekutif FBI, Shawn Henry, dan Ketua Komite Intelijen Senat AS Warner akan berbincang tentang memperkuat postur keamanan

  • IBM Menyambut Baik Persetujuan Parlemen UE atas UU AI UE

    IBM menyambut baik keputusan Parlemen UE untuk mengadopsi UU AI UE, tonggak penting dalam menetapkan regulasi AI yang bertanggung jawab di Uni Eropa. Kerangka Kerja yang Diperlukan UU AI UE menyediakan kerangka kerja yang sangat dibutuhkan untuk memastikan transparansi, akuntabilitas, dan pengawasan manusia dalam mengembangkan dan menerapkan teknologi AI. Meskipun pekerjaan penting harus dilakukan untuk memastikan UU tersebut berhasil diimplementasikan, IBM percaya bahwa regulasi tersebut akan menumbuhkan kepercayaan dan keyakinan pada sistem AI sambil mendorong inovasi dan daya saing. Dukungan IBM “Saya memuji UE atas kepemimpinannya dalam mengesahkan undang-undang AI yang komprehensif dan cerdas. Pendekatan berbasis risiko sejalan dengan komitmen IBM terhadap praktik AI yang etis dan akan berkontribusi pada pembangunan ekosistem AI yang terbuka dan tepercaya,” kata Christina Montgomery, Wakil Presiden dan Chief Privacy & Trust Officer di IBM. “IBM siap meminjamkan teknologi dan keahlian kami – termasuk prod

  • Kompleksitas Tersembunyi Kemiripan Kosinus dalam Data Berdimensi Tinggi: Penyelaman Mendalam ke Model Linear dan Lebih Jauh

    Pendahuluan Menanamkan entitas ke dalam ruang vektor merupakan teknik penting dalam ilmu data dan kecerdasan buatan, yang memungkinkan representasi numerik objek seperti kata, pengguna, dan item. Metode ini memfasilitasi kuantifikasi kesamaan di antara entitas, di mana vektor yang lebih dekat dalam ruang dianggap lebih mirip. Kemiripan Kosinus: Metrik yang Dipertanyakan Kemiripan kosinus adalah metrik yang mengukur kosinus sudut antara dua vektor dan merupakan metrik yang disukai untuk tujuan ini. Metrik ini dielu-elukan karena kemampuannya menangkap kedekatan semantik atau relasional antara entitas dalam ruang vektor yang ditransformasikan ini. Namun, penelitian dari Netflix Inc. dan Cornell University menantang keandalan kemiripan kosinus sebagai metrik universal. Investigasi mereka mengungkap bahwa, bertentangan dengan kepercayaan umum, kemiripan kosinus terkadang dapat menghasilkan hasil yang sewenang-wenang dan bahkan menyesatkan. Pengungkapan ini mendorong evaluasi ulang penerapannya, terutama dalam kon

  • Model Bahasa 7B Umum Telah Memiliki Kemampuan Matematika yang Kuat

    Model Bahasa yang Mengesankan Model Bahasa Besar (LLM) telah menunjukkan kemampuan yang mengesankan di hampir setiap domain. Dari menghasilkan konten unik seperti manusia, menjawab pertanyaan hingga meringkas paragraf tekstual yang besar, menyelesaikan kode, dan menerjemahkan bahasa, LLM adalah salah satu kemajuan terbaik di bidang Kecerdasan Buatan (AI). Kemampuan Matematika LLM Namun, secara umum diyakini bahwa agar model bahasa memiliki kemampuan matematika yang hebat, model tersebut harus sangat luas dalam skala atau melalui proses pra-pelatihan yang ketat yang melibatkan matematika. Sebuah penelitian terbaru menantang gagasan ini dengan menunjukkan bahwa model LLaMA-2 7B telah menunjukkan kemampuan matematika yang luar biasa, bahkan dengan pra-pelatihan standar. Akurasi Matematika yang Tinggi Model ini dapat memilih respons optimal dari 256 generasi acak dengan tingkat akurasi yang luar biasa, yaitu 97,7% dan 72,0% pada tolok ukur GSM8K dan MATH, masing-masing. Hambatan Model Dasar Masalah utama dengan m

  • Melihat dan Mendengar: Menjembatani Dunia Visual dan Audio dengan AI

    Pengantar Kemajuan pesat dalam kecerdasan buatan (AI) telah memungkinkan pembuatan gambar, video, dan suara yang sangat mirip dengan aslinya. Namun, kemajuan ini sebagian besar berfokus pada satu modalitas, mengabaikan sifat dunia kita yang multimodal. Kerangka Kerja Terpadu Untuk mengatasi keterbatasan ini, para peneliti telah mengembangkan kerangka kerja berbasis optimasi yang dirancang untuk mengintegrasikan pembuatan konten visual dan audio secara mulus. Pendekatan inovatif ini memanfaatkan model terlatih yang ada, terutama model ImageBind, untuk membuat ruang representasi bersama yang memfasilitasi pembuatan konten yang kohesif secara visual dan audio. Sinkronisasi Video dan Audio Menyinkronkan pembuatan video dan audio menghadirkan serangkaian kompleksitas yang unik. Metode tradisional, yang sering kali melibatkan pembuatan video dan audio dalam tahap terpisah, gagal memberikan kualitas dan kontrol yang diinginkan. Para peneliti telah memanfaatkan potensi model yang sudah ada sebelumnya yang unggul dala

  • Filip Vítek Bergabung dengan CommentSold sebagai EVP untuk Memimpin Pengembangan AI

    Pengalaman Vítek di Bidang E-Commerce CommentSold, platform perdagangan video terkemuka, telah mengumumkan penunjukan Filip Vítek sebagai EVP, AI dan Data. Dengan Vítek sebagai pemimpin, CommentSold akan mengintegrasikan solusi AI canggih ke dalam ekosistem perdagangan video lengkapnya, mengembangkan fitur yang memungkinkan pengecer membuat visual baru dengan cepat berdasarkan konten yang ada, menambah penjualan langsung mereka, dan mempersingkat waktu peluncuran ke pasar untuk produk baru. Tanggung Jawab Vítek Di CommentSold, Vítek akan bertanggung jawab untuk menggerakkan inisiatif strategis seputar AI dan analitik data, memimpin penerapan alat AI canggih untuk mempercepat dan mengoptimalkan pembuatan konten, pemasaran bisnis, dan manajemen operasi ritel. Secara bersamaan, Vítek dan timnya akan mengembangkan fitur yang meningkatkan pengalaman konten video bagi pengguna. Ia juga akan mengawasi pengembangan inisiatif data baru di CommentSold, yang bertujuan untuk membuka potensi pendapatan baru bagi perusahaa

  • Kolaborasi Stratascale dan Dataminr Hadirkan Peringatan Real-Time Berbasis AI untuk ASC

    Pengantar Meningkatnya serangan siber yang memanfaatkan kecerdasan buatan (AI) menuntut tim keamanan untuk mengandalkan AI yang canggih. Stratascale, sebuah perusahaan SHI, menjalin kemitraan dengan platform AI terkemuka, Dataminr, untuk membekali Chief Information Security Officer (CISO) dan tim mereka dengan alat untuk mengidentifikasi dan merespons ancaman siber, digital, dan fisik-siber. Peningkatan Kemampuan Pengelolaan Permukaan Serangan Stratascale mengintegrasikan Dataminr Pulse for Cyber Risk ke dalam layanan kontrol permukaan serangan (ASC), yang memungkinkan klien untuk terus mengelola, menguji, dan memvalidasi permukaan serangan mereka melampaui kemampuan standar alat pengelolaan permukaan serangan. Platform AI Dataminr yang canggih memiliki posisi unik untuk melindungi orang dan aset dari ancaman fisik, siber, dan digital secara real-time. Intelijen yang dapat ditindaklanjuti dan real-time dari Dataminr memungkinkan Stratascale memberikan visibilitas dan kesadaran risiko yang lebih besar sebagai

  • Pasar Dataloop AI: Mempercepat Pengembangan AI dan Mengurangi Waktu ke Pasar

    Pendahuluan Dataloop AI, platform pengembangan AI yang berpusat pada data, telah meluncurkan Pasarnya untuk merevolusi pengembangan aplikasi AI. Pasar ini menyederhanakan proses, mempercepat alur kerja, dan memungkinkan tim membangun aplikasi AI yang lebih efisien. Tantangan Pengembangan AI Meskipun AI menjanjikan, sekitar 80% proyek AI gagal karena tantangan seperti: Tujuan yang tidak jelas Pendekatan monolitik Kualitas data yang tidak memadai Kesenjangan keterampilan teknis Alat yang terfragmentasi dan proses yang terisolasi Solusi Pasar Dataloop Pasar Dataloop mengatasi tantangan ini dengan: Memungkinkan transisi yang mulus dari POC ke produksi skala penuh Menyediakan dukungan untuk semua tahap pengembangan aplikasi AI Meningkatkan efisiensi alur kerja dan kelincahan Memanfaatkan model AI untuk mempercepat proses anotasi Mengotomatiskan tugas seperti persiapan data dan pelabelan Menyediakan akses ke berbagai model LLM, GenAI, dan multi modalitas Mengorkestrasi rangkaian alat yang komprehensif pada jalur da

  • Pembaruan Harian AI: Pembaruan Terbesar Pembelajaran Mesin, Robotika, dan Otomatisasi

    Oracle Menyediakan Landasan untuk Layanan Kesehatan yang Lebih Cerdas Oracle mengumumkan peningkatan signifikan pada Oracle Health Data Intelligence, termasuk layanan AI generatif baru untuk membantu meningkatkan efisiensi manajemen perawatan. Oracle Health Data Intelligence, sebelumnya HealtheIntent, adalah rangkaian modular aplikasi cloud, layanan, dan analitik. Akamai dan Neural Magic Bermitra untuk Mempercepat Pembelajaran Mendalam AI Akamai Technologies, perusahaan cloud yang memberdayakan dan melindungi kehidupan online, dan Neural Magic, pengembang perangkat lunak yang mempercepat beban kerja kecerdasan buatan (AI), mengumumkan kemitraan strategis yang dimaksudkan untuk meningkatkan kemampuan pembelajaran mendalam pada infrastruktur komputasi terdistribusi Akamai. Google Cloud Mengumumkan Kemajuan GenAI untuk Organisasi Kesehatan dan Ilmu Hayati Di HIMSS24, Google Cloud mengumumkan beberapa solusi baru untuk membantu organisasi kesehatan dan ilmu hayati memungkinkan interoperabilitas, membangun fondasi

  • Tensai GPT: Inovasi AI Hexaware yang Didukung Azure Open AI

    Hexaware, penyedia layanan TI global dan solusi digital terkemuka, mengumumkan peluncuran tensai GPT, aplikasi web AI, bekerja sama dengan Microsoft. Menggunakan Layanan Microsoft Azure Open AI, aplikasi web AI ini akan memungkinkan karyawan Hexaware memanfaatkan pengetahuan perusahaan, mendorong kreativitas di berbagai industri. Peluncuran ini menggarisbawahi komitmen Hexaware untuk meningkatkan kolaborasi manusia-mesin, memanfaatkan keahlian teknis dan industrinya yang luas. Peluncuran yang Penting Arun ‘Rak’ Ramchandran, Presiden & Kepala Global – Konsultasi & Praktik GenAI, Hi-Tech & Layanan Profesional, Hexaware, menyebut peluncuran tensai GPT sebagai peristiwa penting, “Saat kita menavigasi era kemajuan teknologi yang belum pernah terjadi sebelumnya, peluncuran tensai GPT menandai momen penting bagi komitmen Hexaware untuk inovasi tanpa henti.” Arun menambahkan, “Ini akan membantu perjalanan transformatif kami, di mana solusi teknologi canggih dan otomatisasi menyeluruh mendefinisikan kembali lanskap la

  • Veeam dan Microsoft Berkolaborasi dalam Solusi AI untuk Platform Perlindungan Data Teratas

    Kemitraan Strategis Veeam telah mengumumkan kemitraan strategis lima tahun dengan Microsoft untuk mengembangkan solusi inovatif dalam melindungi pelanggan dengan mengintegrasikan rangkaian produk Veeam dan layanan Microsoft Copilot dan AI. Perlindungan Data untuk Microsoft 365 dan Microsoft Azure Selain inovasi bersama, kedua perusahaan akan menghadirkan perlindungan data untuk Microsoft 365 dan Microsoft Azure dengan Veeam Data Cloud yang baru-baru ini diumumkan. Inovasi Bersama Melalui kolaborasi teknik selama bertahun-tahun, Veeam dan Microsoft akan mengembangkan kemampuan untuk menjaga organisasi tetap beroperasi dalam menghadapi meningkatnya serangan keamanan siber, pemadaman, dan bencana alam. Kombinasi kemampuan pencadangan dan pemulihan Veeam yang terdepan di pasar dengan inovasi dan skala Microsoft yang luas akan membantu pelanggan memastikan ketahanan siber. Manfaat Kemitraan Kemitraan ini akan memberikan manfaat sebagai berikut: Kemampuan AI tambahan untuk produk pencadangan dan pemulihan Veeam Duk

  • DoiT Raih Kompetensi AI Generatif AWS

    Pengakuan Kemampuan Teknis dan Keberhasilan Pelanggan DoiT International (DoiT), penyedia terkemuka teknologi FinOps cerdas dan keahlian cloud yang tak tertandingi, mengumumkan bahwa mereka telah mencapai Kompetensi AI Generatif Amazon Web Services (AWS). Spesialisasi ini mengakui DoiT sebagai Mitra AWS yang membantu pelanggan dan Jaringan Mitra AWS (APN) mendorong kemajuan layanan, alat, dan infrastruktur yang sangat penting untuk menerapkan teknologi AI generatif. “KAMI SANGAT BANGGA DAN TERSANJUNG MENDAPATKAN KOMPETENSI AWS BARU INI, YANG MENYOROETI KARYA INOVATIF YANG DILAKUKAN TEKNISI KEANDALAN PELANGGAN KAMI DALAM MEMPERCEPAT ADOPSI AI GENERATIF BERSAMA PELANGGAN KAMI” Meraih Kompetensi AI Generatif AWS membedakan DoiT sebagai Mitra AWS yang telah menunjukkan kemahiran teknis dan keberhasilan pelanggan yang terbukti dalam mendukung perusahaan untuk menentukan kesiapan internal, mengidentifikasi kasus penggunaan spesifik, dan mengembangkan solusi AI generatif khusus dari ujung ke ujung. “Kami sangat bang

  • Kolaborator Pemodelan: Kerangka Kecerdasan Buatan Baru yang Memungkinkan Siapa Saja Melatih Model Visi Menggunakan Interaksi Bahasa Alami dan Upaya Minimal

    Pengantar Visi komputer secara tradisional berfokus pada pengenalan konsep yang disepakati secara objektif seperti hewan, kendaraan, atau objek tertentu. Namun, banyak aplikasi praktis di dunia nyata memerlukan identifikasi konsep subjektif yang dapat sangat bervariasi di antara individu, seperti memprediksi emosi, menilai daya tarik estetika, atau memoderasi konten. Tantangan Misalnya, apa yang dianggap konten “tidak aman” mungkin berbeda berdasarkan perspektif individu, dan definisi “gourmet” seorang kritikus makanan mungkin tidak sesuai dengan definisi orang lain. Ada kebutuhan yang berkembang akan kerangka kerja pelatihan yang berpusat pada pengguna untuk mengatasi tantangan ini yang memungkinkan siapa saja melatih model visi subjektif yang disesuaikan dengan kriteria spesifik mereka. Solusi: Kolaborator Pemodelan Agile Modeling baru-baru ini memperkenalkan kerangka kerja pengguna-dalam-lingkaran untuk memformalkan transformasi konsep visual apa pun menjadi model visi. Namun, pendekatan yang ada seringkal

  • Transformasi Teks ke Visual: Kolaborasi AWS AI Labs dan University of Waterloo dengan MAGID

    Pengantar Sistem multimodal yang menggabungkan teks dan gambar menawarkan interaksi yang lebih alami dan menarik antara manusia dan mesin. Namun, sistem ini sangat bergantung pada kumpulan data yang menggabungkan elemen-elemen ini secara bermakna. MAGID: Kerangka Kerja Generatif MAGID (Multimodal Augmented Generative Images Dialogues) adalah kerangka kerja inovatif yang dikembangkan oleh para peneliti dari University of Waterloo dan AWS AI Labs. Pendekatan ini merevolusi pembuatan dialog multimodal dengan mengintegrasikan gambar sintetis berkualitas tinggi dan beragam dengan dialog teks. Komponen Utama MAGID MAGID terdiri dari tiga komponen inti: Pemindai berbasis LLM Generator gambar berbasis difusi Modul jaminan kualitas yang komprehensif Proses Pembuatan Dialog Pemindai mengidentifikasi ujaran teks dalam dialog yang akan mendapat manfaat dari penambahan visual. Model difusi menghasilkan gambar yang melengkapi ujaran yang dipilih dan memperkaya dialog secara keseluruhan. Modul jaminan kualitas mengevaluasi

  • Representasi Linear Konsep dalam Model Bahasa Besar: Mengungkap Kesederhanaan di Balik Kompleksitas

    Pengantar Dalam lanskap kecerdasan buatan yang terus berkembang, studi tentang bagaimana mesin memahami dan memproses bahasa manusia telah mengungkap wawasan yang menarik, khususnya dalam model bahasa besar (LLM). Keajaiban digital ini, yang dirancang untuk memprediksi kata-kata berikutnya atau menghasilkan teks, mewujudkan dunia kompleksitas yang mendasari kesederhanaan pendekatan mereka terhadap bahasa. Representasi Konsep Linear dalam LLM Salah satu aspek menarik dari LLM yang telah menarik minat komunitas akademis adalah metode representasi konsep mereka. Secara tradisional, orang mungkin mengharapkan model ini menggunakan mekanisme rumit untuk mengodekan nuansa bahasa. Namun, pengamatan mengungkapkan pendekatan yang sangat sederhana: konsep sering kali dikodekan secara linear. Pengungkapan ini menimbulkan pertanyaan menarik: Bagaimana model kompleks merepresentasikan konsep semantik dengan begitu sederhana? Hipotesis Representasi Linear Peneliti dari University of Chicago dan Carnegie Mellon University t

  • Kecerdasan Buatan Melampaui Batas Manusia: Merevolusi Prediksi Neurosains dengan ‘BrainGPT’

    Pendahuluan Kemajuan pesat ilmu pengetahuan, khususnya di bidang neurosains, telah menciptakan tantangan berat dalam menganalisis dan mensintesis sejumlah besar penelitian. Neurosains menjadi contoh nyata kesulitan yang dihadapi peneliti dalam mengintegrasikan temuan yang beragam menjadi pemahaman yang koheren. Batasan Pendekatan Tradisional Volume data yang sangat besar dan interaksi kompleks antara faktor genetik, molekuler, dan lingkungan yang memengaruhi fungsi otak menyoroti keterbatasan pendekatan tradisional yang hanya mengandalkan keahlian manusia. Hambatan utama dalam wacana ini adalah keterbatasan kognitif manusia dalam mencerna dan mensintesis literatur ilmiah yang terus berkembang. Model Bahasa Besar (LLM) sebagai Solusi Berbeda dengan manusia, LLM tidak dibatasi oleh keterbatasan bandwidth kognitif dan informasi yang sama. Peneliti dari berbagai lembaga bergengsi memperkenalkan perubahan paradigma dengan mengembangkan BrainGPT, sebuah LLM yang disesuaikan dengan kumpulan literatur neurosains. Mer

  • Meningkatkan Penalaran Model Bahasa dengan Iterasi Pakar: Menjembatani Kesenjangan Melalui Pembelajaran Penguatan

    Kemajuan Model Bahasa Besar (LLM) Kemampuan LLM berkembang pesat, terbukti dari kinerjanya dalam berbagai tolok ukur dalam tugas matematika, sains, dan pengkodean. Bersamaan dengan itu, kemajuan dalam Pembelajaran Penguatan dari Umpan Balik Manusia (RLHF) dan penyesuaian halus instruksi menyelaraskan LLM lebih dekat dengan preferensi manusia. Kemajuan ini meningkatkan kemampuan LLM yang tampak, membuat perilaku kompleks lebih mudah diakses melalui permintaan instruksi. Strategi permintaan inovatif seperti Chain-of-Thought atau Tree-of-Thoughts semakin meningkatkan penalaran LLM. Integrasi Pembelajaran Penguatan Mengambil dari keberhasilan teknik RL yang terlihat di lingkungan permainan, mengintegrasikan RL ke dalam penalaran LLM merupakan perkembangan alami, yang memanfaatkan dinamika pemecahan masalah interaktif untuk meningkatkan kinerja. Para peneliti dari Meta, Georgia Institute of Technology, StabilityAI, dan UC Berkeley telah menyelidiki efektivitas berbagai algoritme RL dalam meningkatkan kemampuan pen

  • Bot AI Generatif untuk Perusahaan, Mengatasi Ketidak efisienan Dukungan Pelanggan

    Pengantar Cuber Inc, perusahaan rintisan hiperotomatisasi yang berbasis di Silicon Valley, mengumumkan ketersediaan umum Cuber Generative AI Bots, yang memungkinkan perusahaan dengan manusia digital dan chatbot bertenaga AI untuk pengalaman pelanggan yang lebih baik. Bot AI Generatif Bot AI generatif Cuber dibangun di atas standar terbuka dan arsitektur berbasis komponen. Bot ini didukung oleh lingkungan kode rendah dan dirancang untuk menyelesaikan tiket layanan secara real-time dengan AI & Otomatisasi, sehingga mengurangi hingga 90 persen biaya operasional untuk perusahaan. Manfaat bagi Perusahaan Perusahaan dapat memanfaatkan Cuber Generative AI Bots untuk: Dukungan yang Disederhanakan: Dengan menerapkan otomatisasi, layanan mandiri meningkat hingga 90% dalam 30 hari pertama penerapan. Resolusi Tiket Lebih Cepat: Perusahaan dapat melihat transisi yang mulus antara agen manusia dan digital saat bekerja dengan tiket TI dan dukungan, memberikan konteks situasional yang lengkap. Dengan demikian, produktivitas

  • Platform Avatar Digital Copresence Hadirkan Rendering Avatar AI

    Avatar AI Avatar AI Copresence mengutamakan fotorealisme dan menangkap kehalusan ekspresi wajah, menjadikannya ideal untuk XR dan interaksi waktu nyata. Avatar CG vs Avatar AI Platform Copresence kini menawarkan dua pendekatan berbeda untuk pembuatan avatar: Avatar CG: Aset 3D klasik yang dibuat melalui grafik komputer, cocok untuk metaverse dan industri game. Avatar AI: Dibuat oleh kecerdasan buatan, mengutamakan fotorealisme dan kemiripan yang melampaui “uncanny valley”. Fitur Avatar AI Dirender secara real-time pada 60 FPS pada laptop konsumen. Menangkap kehalusan ekspresi wajah. Ideal untuk konferensi video XR dan aplikasi interaksi waktu nyata. Aplikasi Avatar Copresence Pembuatan karakter terperinci untuk pengembang game. Integrasi avatar realistis dalam konferensi video. Lingkungan XR 3D dan komputasi spasial. Masa Depan Avatar Copresence Copresence berkomitmen untuk meningkatkan: Kecepatan pembuatan avatar AI. Jangkauan rendering waktu nyata ke lebih banyak perangkat. Mode perekaman inovatif.

  • Kemajuan ModMed dalam Mengembangkan AI

    Pilar Utama Pengembangan AI ModMed, pemimpin teknologi praktik dan pionir EHR, mengungkapkan kemajuannya dalam menanamkan AI di seluruh rangkaian solusinya dengan cara yang diyakini perusahaan akan memberikan kontribusi paling signifikan dalam meningkatkan layanan kesehatan. “Kami telah membawa AI yang bertanggung jawab dan dapat dijelaskan ke depan dan telah mengatur pengembangan kami di sekitar prinsip inti kepercayaan, transparansi, dan akurasi,” kata Dr. Michael Sherling, salah satu pendiri dan Chief Medical and Strategy Officer di ModMed. “Nilai sebenarnya dalam AI terletak pada pengurangan beban administrasi yang membebani layanan kesehatan,” kata Dr. Sherling. “Fokus kami adalah mengurangi kelelahan staf sekaligus membebaskan waktu penyedia untuk melakukan apa yang paling mereka sukai, yaitu memberikan perawatan pasien secara langsung. Membawa AI ke dalam persamaan akan menghemat waktu praktik dengan mengurangi tugas administratif yang biasanya dibebankan pada penyedia medis, staf klinis, dan staf admi

  • LG Bermitra dengan SVT Robotics untuk Mempercepat Penerapan Robot Seluler Otonom

    Kerja Sama Perusahaan Terkemuka LG Business Solutions USA berkolaborasi dengan SVT Robotics, penyedia perangkat lunak terkemuka yang memberdayakan tim IT untuk mengintegrasikan, memantau, dan meningkatkan otomatisasi dengan mulus, untuk menerapkan robot seluler otonom (AMR) LG CLOi CarryBot yang baru di lingkungan pergudangan AS. Dengan memanfaatkan Platform SOFTBOT dari SVT Robotics, integrasi yang telah dibuat sebelumnya memungkinkan LG CLOi CarryBot AMR terhubung ke hampir semua solusi manajemen pergudangan. Manfaat Integrasi Menurut Tom Bingham, Direktur Senior di LG Business Solutions USA, Platform SOFTBOT memungkinkan pelanggan LG CLOi CarryBot untuk dengan cepat menerapkan robot baru tanpa perlu kode khusus, sehingga mengurangi risiko dan meminimalkan beban TI. “Robotika otonom menciptakan peluang baru untuk meningkatkan efisiensi pergudangan, produktivitas, profitabilitas, dan kesejahteraan karyawan,” kata Bingham. “Kami mencari SVT Robotics karena peran penting yang dimainkan penyedia teknologi pergu

  • Program Hibah $1 Juta ChainGPT untuk Startup Web3-AI

    Pendahuluan ChainGPT, infrastruktur Web3 bertenaga AI yang menyediakan beragam alat dan layanan, mengumumkan peluncuran program hibah untuk memfasilitasi inovasi di persimpangan AI dan blockchain. Dengan total hibah hingga $1 juta yang tersedia untuk startup di berbagai tahap pengembangan, ChainGPT akan menawarkan tiga tingkatan pendanaan: Hibah pertumbuhan yang berfokus pada penskalaan Hibah pembangun untuk memulai inovasi tahap awal Hibah penelitian untuk proyek yang baru diluncurkan Tujuan Program Hibah Program hibah ini sejalan dengan misi utama ChainGPT untuk meningkatkan ruang blockchain dengan solusi bertenaga AI dan mendukung pengembang Web3 yang membangun teknologi AI yang dirancang untuk blockchain. Tujuan utama program ini adalah untuk menghilangkan hambatan masuk bagi startup, menyediakan mereka dengan sumber daya yang diperlukan untuk memungkinkan inovasi berkembang dengan memberdayakan mereka dengan teknologi AI yang disesuaikan dengan aplikasi blockchain. Akses ke Ekosistem ChainGPT Fitur inti

  • Teknologi GaN dan SiC Navitas Mendukung Pengiriman Daya AI Generasi Berikutnya

    Tantangan Industri yang Signifikan Pusat data AI membutuhkan peningkatan daya 3x lipat, menciptakan tantangan industri yang signifikan. Roadmap Teknologi Navitas Navitas Semiconductor, perusahaan semikonduktor daya generasi berikutnya yang fokus pada teknologi daya gallium nitride (GaN) dan silikon karbida (SiC), telah mengumumkan peta jalan teknologi pusat data AI mereka untuk peningkatan daya hingga 3x lipat guna mendukung pertumbuhan eksponensial serupa dalam permintaan daya AI yang diperkirakan hanya dalam 12-18 bulan ke depan. Platform Daya Server Untuk memenuhi peningkatan daya eksponensial ini, Navitas mengembangkan platform daya server yang meningkat pesat dari 3kW hingga 10kW. Platform 3,2kW: Memanfaatkan teknologi GaN terbaru, memungkinkan lebih dari 100W/in3 dan efisiensi lebih dari 96,5%. Platform 4,5kW: Menggabungkan GaN dan SiC, mendorong kepadatan lebih dari 130W/in3 dan efisiensi lebih dari 97%. Platform Daya 8-10kW Navitas berencana untuk memperkenalkan platform daya 8-10kW pada akhir tahun 2

  • Peningkatan Penggunaan Alat pada Model Bahasa Besar: Jalan Menuju Presisi dengan Percobaan dan Kesalahan yang Disimulasikan

    Pengantar Pengembangan model bahasa besar (LLM) dalam kecerdasan buatan, seperti seri GPT OpenAI, menandai era transformatif, membawa dampak mendalam di berbagai sektor. Model canggih ini telah menjadi landasan untuk menghasilkan keluaran teks yang kaya konteks dan koheren, memfasilitasi aplikasi dari pembuatan konten otomatis hingga interaksi layanan pelanggan yang bernuansa. Namun, ketika diintegrasikan dengan alat eksternal, kemampuan mereka melampaui pembuatan teks. Tantangan: Presisi Penggunaan Alat Meskipun prospeknya menarik, mengintegrasikan LLM dengan alat eksternal mengungkap tantangan penting: presisi penggunaan alat oleh model ini masih perlu ditingkatkan. Kesenjangan ini signifikan; agar LLM benar-benar memperluas utilitas dan aplikasinya, mereka harus mengakses berbagai alat dan menggunakannya dengan akurasi tinggi. Statistik terkini, termasuk dari model inovatif seperti GPT-4, menunjukkan tingkat kebenaran penggunaan alat yang kurang dari standar, menekankan perlunya metodologi yang ditingkatka

  • INSTRUCTIR: Tolok Ukur Pembelajaran Mesin Baru untuk Mengevaluasi Instruksi yang Diikuti dalam Pengambilan Informasi

    Pendahuluan Model Bahasa Besar (LLM) semakin disesuaikan untuk menyelaraskan dengan preferensi dan instruksi pengguna di berbagai tugas generatif. Penyelarasan ini sangat penting bagi sistem pengambilan informasi untuk memenuhi berbagai tujuan dan preferensi pencarian pengguna secara efektif. Kesenjangan dalam Sistem Pengambilan Informasi Sistem pengambilan informasi saat ini sering kali perlu ditingkatkan dan mencerminkan preferensi pengguna secara memadai, dengan hanya berfokus pada kueri yang ambigu dan mengabaikan kebutuhan khusus pengguna. Perlunya tolok ukur yang disesuaikan untuk mengevaluasi sistem pengambilan informasi dalam skenario yang selaras dengan pengguna semakin menghambat pengembangan mekanisme mengikuti instruksi dalam tugas pengambilan informasi. INSTRUCTIR: Tolok Ukur Baru Untuk mengatasi tantangan ini, para peneliti di KAIST telah memperkenalkan tolok ukur terobosan, INSTRUCTIR. Tolok ukur baru ini mengevaluasi kemampuan model pengambilan informasi untuk mengikuti berbagai instruksi yang

  • Benchmark Kemampuan Pemahaman Struktural LLM untuk Tabel

    Pendahuluan Kemampuan Large Language Model (LLM) dalam menyelesaikan tugas yang terkait dengan Natural Language Processing (NLP) dan Natural Language Generation (NLG) menggunakan penalaran few-shot telah meningkatkan popularitasnya. Namun, masih banyak penelitian yang diperlukan tentang pemahaman LLM terhadap data terstruktur, termasuk tabel. Tabel dapat diserialisasi dan digunakan sebagai input untuk LLM, tetapi belum banyak penelitian menyeluruh yang mengevaluasi seberapa baik LLM benar-benar memahami jenis data terstruktur ini. Benchmark Kemampuan Pemahaman Struktural (SUC) Untuk mengatasi hal ini, tim peneliti dari Microsoft telah menyajikan benchmark yang dimaksudkan untuk menilai Kemampuan Pemahaman Struktural (SUC) LLM. Benchmark ini terdiri dari tujuh tugas berbeda, seperti deteksi ukuran, pengambilan baris, dan pencarian sel, masing-masing dengan serangkaian kesulitannya sendiri. Versi model GPT-3.5 dan GPT-4 telah dievaluasi untuk lebih memahami bagaimana kinerja bervariasi tergantung pada opsi inpu

  • DéjàVu: Sistem Pembelajaran Mesin untuk Layanan LLM yang Efisien dan Tahan Kesalahan

    Pengantar Penggunaan Large Language Model (LLM) seperti GPT-3, OPT, dan BLOOM di berbagai antarmuka digital, termasuk chatbot dan alat ringkasan teks, telah menimbulkan kebutuhan penting untuk mengoptimalkan infrastruktur layanannya. LLM terkenal dengan ukurannya yang besar dan sumber daya komputasi yang dibutuhkannya, yang menghadirkan tiga tantangan besar dalam layanannya: penggunaan akselerator perangkat keras secara efisien, pengelolaan jejak memori, dan memastikan waktu henti minimal selama kegagalan. Sistem DéjàVu Para peneliti dari MSR Project Fiddle Intern, ETH Zurich, Carnegie Mellon University, dan Microsoft Research telah dengan cermat mengembangkan sistem DéjàVu baru untuk mengatasi hambatan ini dengan elegan. Inti dari DéjàVu adalah pustaka streaming cache Key-Value (KV) yang serbaguna, yang disebut DéjàVuLib, yang dirancang dengan cerdik untuk menyederhanakan proses layanan LLM. Sistem ini merupakan terobosan karena pendekatannya dalam menangani latensi bimodal yang melekat dalam pemrosesan prom

  • Optimalisasi Lintasan Berbasis Eksplorasi: Memanfaatkan Keberhasilan dan Kegagalan untuk Meningkatkan Pembelajaran Agen Otonom

    Pendahuluan Model bahasa besar (LLM) dalam kecerdasan buatan merupakan suar inovasi, yang mengawali era di mana agen otonom dapat melakukan tugas kompleks dengan presisi yang belum pernah terjadi sebelumnya. Model-model ini, termasuk contoh terkenal seperti GPT-4, memungkinkan agen untuk merencanakan dan melaksanakan tindakan dalam lingkungan yang beragam, mulai dari penjelajahan web hingga penalaran multi-modal. Namun, terlepas dari semua kemampuan mereka, masih terdapat kesenjangan dalam kemampuan agen ini untuk belajar dari pengalaman mereka, khususnya dari percobaan yang tidak berakhir dengan kesuksesan tetapi dengan kegagalan. Metode Optimalisasi Lintasan Berbasis Eksplorasi (ETO) Sebuah tim peneliti dari Allen Institute for AI, School of Computer Science, Peking University, National Key Laboratory for Multimedia Information Processing, Peking University, UCLA, Ohio State University, dan UIUC memperkenalkan metode Optimalisasi Lintasan Berbasis Eksplorasi (ETO) yang inovatif. Metode ini menyimpang dari p

  • IBM dan Usher’s New Look Berkolaborasi dalam Program AI untuk Kesuksesan Karier Siswa

    Pengenalan Usher’s New Look (UNL) dan IBM mengumumkan kolaborasi untuk menyediakan pelatihan kesiapan karier gratis melalui IBM SkillsBuild. Dengan fokus pada kecerdasan buatan (AI) dan keterampilan kerja profesional, IBM akan memberikan UNL pelatihan dan rencana pembelajaran yang disesuaikan untuk siswa. Upaya ini bertujuan untuk menguntungkan ribuan siswa muda UNL di seluruh negeri, termasuk siswa sekolah menengah dan perguruan tinggi dari komunitas yang secara tradisional kurang terwakili dalam teknologi. Pentingnya AI untuk Siswa Penting bagi siswa untuk dilengkapi dengan pemahaman dasar tentang AI dan bagaimana teknologi ini akan membentuk tenaga kerja masa depan. Dalam survei YouGov AS baru-baru ini tentang AI dalam Pendidikan, 61% responden melaporkan bahwa sangat atau agak penting bagi siswa K-12 untuk mempelajari keterampilan terkait AI untuk karier masa depan mereka. Kolaborasi IBM dan UNL “Merupakan suatu kehormatan bagi IBM untuk bergabung dengan Usher’s New Look dalam membuat perbedaan nyata bagi

  • Pemodelan Urutan DNA yang Ditingkatkan: Strategi Tokenisasi Terbaik untuk Model NLP yang Lebih Baik

    Pendahuluan Perpaduan pembelajaran mesin dan genomik telah merevolusi bidang bioteknologi, khususnya dalam pemodelan urutan DNA. Pendekatan interdisipliner ini mengatasi tantangan rumit yang ditimbulkan oleh data genomik, termasuk memahami interaksi jarak jauh dalam genom, pengaruh dua arah daerah genomik, dan sifat unik DNA yang dikenal sebagai komplementaritas terbalik (RC). Kemajuan terbaru di bidang ini telah menghasilkan metode dan alat inovatif untuk meningkatkan akurasi dan efisiensi pemodelan urutan genomik. Tantangan dalam Pemodelan Urutan DNA Salah satu masalah yang terus-menerus dalam penelitian genomik adalah kompleksitas pemodelan interaksi jarak jauh dalam urutan DNA secara akurat. Pendekatan tradisional sering kali perlu menangkap hubungan yang luas dan bernuansa di seluruh bentangan luas genom. Keterbatasan ini telah mendorong para peneliti untuk mengeksplorasi metodologi baru yang dapat dengan tepat menangani ketergantungan jarak jauh ini sambil mengakomodasi sifat dua arah dari pengaruh gene

  • Orca-Math: Model Bahasa Kecil 7B Parameter untuk Meningkatkan Pembelajaran Matematika

    Pendahuluan Teknologi pendidikan terus berkembang pesat, dan pencarian untuk meningkatkan pengalaman belajar tidak pernah berakhir. Matematika merupakan bidang yang sangat menantang, dan metode pengajaran sebelumnya, meskipun mendasar, seringkali perlu diperbarui untuk memenuhi kebutuhan siswa yang beragam, terutama dalam hal keterampilan kompleks pemecahan masalah matematika. Orca-Math: Model Bahasa Kecil untuk Pemecahan Masalah Matematika Microsoft Research telah memperkenalkan alat canggih bernama Orca-Math, didukung oleh model bahasa kecil (SLM) dengan 7 miliar parameter dan berbasis arsitektur Mistral-7B. Pendekatan inovatif ini mendefinisikan ulang strategi tradisional dalam mengajarkan soal cerita matematika, merevolusi cara siswa terlibat dan menguasai mata pelajaran ini. Metodologi Iteratif Tidak seperti metode sebelumnya yang sering mengandalkan panggilan model yang ekstensif dan alat eksternal untuk validasi, Orca-Math menonjol karena solusi yang efisien dan ramping. Metodologi Orca-Math didasarkan

  • Aetina Luncurkan Sistem Edge AI Tanpa Kipas Berbasis NVIDIA Jetson Orin NX dan Nano di NVIDIA GTC 2024

    Pasar Edge AI Global yang Berkembang Pesat Pasar kecerdasan buatan (AI) tepi global sedang berkembang pesat, yang telah mempercepat permintaan mendesak akan perangkat inferensi AI tepi yang andal, berkinerja tinggi, dan sangat fleksibel. Solusi Edge AI Aetina Aetina, penyedia solusi edge AI global terkemuka, mengumumkan peluncuran sistem edge AI ekspansi serbaguna tanpa kipas yang canggih – seri AIE-PN33/43 dan seri AIE-PO23/33. Sistem inovatif ini didukung oleh modul NVIDIA Jetson Orin NX dan Orin Nano, yang menawarkan kinerja komputasi AI yang luar biasa hingga masing-masing 100 TOPS dan 40 TOPS, bersama dengan opsi antarmuka I/O yang fleksibel. Dirancang untuk menangani konektivitas dan kebutuhan pemrosesan data real-time dari berbagai sensor dan perangkat di tepi dengan mulus, solusi ini membantu memberdayakan industri di seluruh dunia untuk menerapkan berbagai aplikasi AI secara efisien. Varian Sistem Untuk memenuhi kebutuhan I/O dan penyimpanan yang beragam dari berbagai aplikasi AI, Aetina telah melunc

  • Model Difusi Teks Inovatif untuk Generasi Teks yang Alami

    Pengantar Dalam bidang linguistik komputasi yang terus berkembang, pencarian model yang dapat menghasilkan teks seperti manusia telah mendorong para peneliti untuk mengeksplorasi teknik inovatif di luar kerangka kerja tradisional. Salah satu pendekatan yang paling menjanjikan akhir-akhir ini adalah eksplorasi model difusi, yang sebelumnya dipuji atas keberhasilannya dalam domain visual dan auditori serta potensinya dalam pembuatan bahasa alami (NLG). Model-model ini telah membuka kemungkinan baru untuk menciptakan teks yang tidak hanya relevan secara kontekstual dan koheren, tetapi juga menunjukkan variabilitas dan adaptabilitas yang luar biasa terhadap gaya dan nada yang berbeda, sebuah rintangan yang banyak metode sebelumnya berjuang untuk diatasi secara efisien. Tantangan dalam Pembuatan Teks Metode pembuatan teks sebelumnya sering kali perlu bekerja untuk menghasilkan konten yang dapat beradaptasi dengan beragam kebutuhan tanpa pelatihan ulang yang ekstensif atau intervensi manual. Tantangan ini sangat te

  • 革新 LLM 训练:GaLore 提升内存效率的新机器学习方法,不影响性能

    背景 训练大型语言模型 (LLM) 由于其内存密集型特性而面临重大挑战。通过压缩模型权重来减少内存消耗的传统方法通常会导致性能下降。然而,加州理工学院、Meta AI、德克萨斯大学奥斯汀分校和卡内基梅隆大学的研究人员提出了一种新方法,即梯度低秩投影 (GaLore),提供了新的视角。 GaLore:一种新的方法 GaLore 专注于梯度而不是模型权重,这是一种独特的方法,有望提高内存效率而不影响模型性能。这种方法不同于传统方法,因为它关注梯度而不是模型权重。通过将梯度投影到低维空间中,GaLore 允许充分探索参数空间,有效地平衡内存效率和模型性能。该技术已显示出在 LLM 开发的预训练和微调阶段保持或超越全秩训练方法的性能。 核心创新 GaLore 的核心创新在于其对梯度投影的独特处理,它将优化器状态中的内存使用量减少了 65.5%,而不会牺牲训练效率。这是通过合并梯度的紧凑表示来实现的,它保持了训练动态的完整性并实现了内存消耗的大幅减少。因此,GaLore 促进了在标准消费级 GPU 上训练数十亿参数的模型,而这以前只能通过复杂的模型并行或大量的计算资源来实现。 适应性和性能 GaLore 的功效延伸到其与各种优化算法的适应性,使其成为现有训练管道的组成部分。它在不同基准的预训练和微调场景中的应用证明了 GaLore 能够以显着降低的内存需求提供有竞争力的结果。例如,GaLore 已使在消费级 GPU 上预训练多达 70 亿参数的模型成为可能,这是 LLM 训练的一个里程碑,突显了该方法改变模型开发格局的潜力。 评估和影响 对 GaLore 的全面评估突出了其优于其他低秩自适应方法的性能。当应用于大规模语言模型时,GaLore 节省了内存并实现了相当或更好的结果,突出了其作为训练策略的有效性。这种性能在既定的 NLP 基准上的预训练和微调中尤为明显,在这些基准中,GaLore 的内存高效方法不会影响结果的质量。 结论 GaLore 在 LLM 训练中取得了重大突破,为内存密集型模型开发的长期挑战提供了一个有力的解决方案。通过其创新的梯度投影技术,GaLore 展示了出色的内存效率,同时保持甚至在某些情况下提高了模型性能。它与各种优化算法的兼容性进一步巩固了其作为研究人员和从业者的多功能且有影响力的工具的地位。GaLore 的出现标志着 LLM 训练民主化的关键时刻,有可能加速自然语言处理和相关领域的进步。

  • Strategi Tokenisasi Terbaik: Greedy Inference dan SaGe Memimpin Model NLP

    Metode Inferensi Metode inferensi sangat penting untuk tokenisasi subkata dalam model NLP. Metode seperti BPE, WordPiece, dan UnigramLM menawarkan pemetaan yang berbeda, tetapi perbedaan kinerjanya harus dipahami dengan lebih baik. Implementasi seperti Huggingface Tokenizers sering kali perlu lebih jelas atau membatasi pilihan inferensi, sehingga mempersulit kompatibilitas dengan algoritma pembelajaran kosakata. Masih belum jelas apakah metode inferensi yang cocok diperlukan atau optimal untuk kosakata tokenizer. Penelitian Sebelumnya Penelitian sebelumnya berfokus pada pengembangan algoritma konstruksi kosakata seperti BPE, WordPiece, dan UnigramLM, mengeksplorasi ukuran kosakata yang optimal dan kosakata multibahasa. Beberapa penelitian meneliti efek kosakata pada kinerja hilir, teori informasi, dan plausibilitas kognitif. Pekerjaan terbatas pada metode inferensi menyelidiki efek acak pada penggabungan BPE dan algoritma pencarian yang canggih. Studi komprehensif harus dilakukan untuk membandingkan metode in

  • LDB: Kerangka Kerja Debugging Berbasis Pembelajaran Mesin dengan LLM

    Pengantar Model bahasa besar (LLM) telah merevolusi pembuatan kode dalam pengembangan perangkat lunak, menyediakan alat bagi pengembang untuk mengotomatiskan tugas pengkodean yang kompleks. Namun, secanggih apa pun model ini, pembuatan kode yang sempurna dan terikat logika memerlukan kemampuan debugging yang canggih di luar standar saat ini. Tantangan Debugging LLM Pendekatan debugging tradisional sering kali gagal mengatasi kebutuhan untuk mengatasi nuansa rumit logika pemrograman dan operasi data yang melekat dalam kode yang dihasilkan LLM. Kerangka Kerja LDB Menyadari kesenjangan ini, peneliti dari University of California, San Diego, telah mengembangkan Large Language Model Debugger (LDB), sebuah kerangka kerja inovatif yang dirancang untuk menyempurnakan debugging dengan memanfaatkan informasi eksekusi waktu proses. Strategi inovatif LDB sangat berbeda dari metodologi yang ada dengan mendekonstruksi program menjadi blok dasar. Dekomposisi ini memungkinkan analisis mendalam nilai variabel antara selama ek

arrow_drop_down

ブログリーダー」を活用して、hiromiさんをフォローしませんか?

ハンドル名
hiromiさん
ブログタイトル
セラミドコスメのオススメ
フォロー
セラミドコスメのオススメ

にほんブログ村 カテゴリー一覧

商用