chevron_left

メインカテゴリーを選択しなおす

cancel
hiromi
フォロー
住所
未設定
出身
未設定
ブログ村参加

2018/12/09

arrow_drop_down
  • Copilot Bertenaga AI Microsoft Mendapat Fitur Baru

    Peningkatan Fungsi Copilot Microsoft Copilot yang didukung AI kini memiliki metode baru untuk mengaktifkan asisten selama percakapan rapat, ringkasan, dan interaksi Microsoft Teams lainnya. Dalam beberapa bulan mendatang, Copilot akan mengintegrasikan diskusi tekstual dan transkrip audio ke dalam satu layar, sehingga lebih mudah untuk mengejar rapat yang terlewat. Saat ini, Copilot dapat meringkas rapat Teams. Microsoft mengklaim bahwa “akan tersedia secara umum pada kuartal berikutnya dengan Teams Premium”, fitur rekap panggilan cerdas untuk panggilan Teams biasa yang dilakukan langsung ke telepon. Rekap panggilan cerdas menghilangkan kebutuhan untuk mencatat secara tidak nyaman selama panggilan dengan meringkasnya secara otomatis dan menunjukkan kepada Anda apa yang harus dilakukan selanjutnya. Fitur Baru Selain peningkatan Copilot di Teams, Microsoft juga mengumumkan alat rapat hibrida baru di Teams untuk meningkatkan pengalaman bagi peserta jarak jauh dan di dalam ruangan. Peralihan Kamera Otomatis Intell

  • GenStudio Adobe Bantu Merek Personalisasikan Upaya Pemasaran

    Upaya Pemasaran yang Dipersonalisasi Merek berupaya menyesuaikan pesan dan menjangkau calon pelanggan di berbagai saluran yang terus bertambah. Di sinilah AI generatif berperan, karena dapat mempersingkat waktu pembuatan konten secara signifikan. Analisis Terintegrasi Fitur paling menarik dari layanan baru ini bagi pemasar berbasis data adalah analitik terintegrasinya. Pengguna dapat menelusuri detail kecil untuk mengetahui alasan kinerja kampanye tertentu, lalu menyesuaikan postingan sosial atau iklan berikutnya berdasarkan hal tersebut. Wawasan ini dimulai dari tingkat kampanye. Keamanan Merek Meskipun merek tertarik untuk mempersonalisasi upaya pemasaran mereka dengan AI generatif, mereka juga khawatir AI dapat salah mengartikan pesan mereka dan merusak reputasi. Adobe meluncurkan GenStudio di konferensi Summit tahunannya di Las Vegas, yang menggabungkan AI generatif dengan janji keamanan merek. Perangkat lunak ini membantu merek membuat konten dan mengukur keberhasilannya. Integrasi Produk Adobe GenStudio

  • Model Penyelaman Teks Kompak dan Serbaguna Bertenaga Pengetahuan Dunia yang Luas dari LLM

    Pendahuluan Dalam pemrosesan bahasa alami, upaya untuk menciptakan model yang dapat memahami dan memproses teks dengan akurasi seperti manusia terus dilakukan. Salah satu tantangan yang menonjol adalah merancang model yang dapat secara efisien mengonversi sejumlah besar informasi tekstual ke dalam bentuk yang dapat dipahami dan ditindaklanjuti oleh mesin. Model Penyelaman Teks Model penyelaman teks berfungsi untuk tujuan ini dengan mengubah teks menjadi vektor padat, sehingga memungkinkan mesin untuk mengukur kesamaan semantik, mengklasifikasikan dokumen, dan mengambil informasi berdasarkan relevansi konten. Namun, pembuatan model seperti itu sebelumnya bergantung pada kumpulan data beranotasi manual yang besar, yang merupakan proses yang memakan waktu dan sumber daya. Gecko: Model Penyelaman Teks Bertenaga LLM Para peneliti dari Google DeepMind memperkenalkan Gecko, sebuah model penyelaman teks yang inovatif. Gecko membedakan dirinya dengan memanfaatkan model bahasa besar (LLM) untuk penyulingan pengetahuan.

  • DRAGIN: Kerangka Kerja Pembelajaran Mesin Baru untuk Penambahan Pengambilan Dinamis pada Model Bahasa Besar dan Mengungguli Metode Konvensional

    Pengenalan Paradigma Pembangkitan Penambahan Pengambilan Dinamis (RAG) bertujuan untuk meningkatkan kinerja LLM dengan menentukan kapan harus mengambil informasi eksternal dan apa yang harus diambil selama pembuatan teks. Metode saat ini sering bergantung pada aturan statis untuk memutuskan kapan harus mengambil dan membatasi pengambilan pada kalimat atau token terbaru, yang mungkin tidak menangkap konteks penuh. Pendekatan ini berisiko memasukkan data yang tidak relevan dan meningkatkan biaya komputasi secara tidak perlu. Strategi efektif untuk waktu pengambilan yang optimal dan pembuatan kueri yang relevan sangat penting untuk meningkatkan pembuatan LLM sekaligus mengurangi tantangan ini. Kerangka Kerja DRAGIN Peneliti dari Universitas Tsinghua dan Institut Teknologi Beijing telah mengembangkan DRAGIN, kerangka kerja Pembangkitan Penambahan Pengambilan Dinamis yang dirancang khusus untuk LLM. DRAGIN secara dinamis menentukan kapan dan apa yang akan diambil berdasarkan kebutuhan informasi waktu nyata selama

  • Perusahaan AI dari Y Combinator yang Melatih Model AI Sendiri

    Pendahuluan Dalam bidang kecerdasan buatan (AI) yang berkembang pesat, narasi yang berlaku sering berfokus pada sumber daya besar yang diperlukan untuk membangun model AI dasar, seperti upaya raksasa seperti OpenAI dan Anthropic. Kisah-kisah ini memunculkan gambaran anggaran miliaran dolar dan kekuatan komputasi yang besar, yang tampaknya di luar jangkauan perusahaan rintisan dan perusahaan kecil. Namun, kenyataan, seperti yang ditunjukkan oleh Y Combinator (YC), akselerator perusahaan rintisan yang terkenal, menceritakan kisah yang sangat berbeda dan lebih menggembirakan tentang demokratisasi teknologi AI. Perusahaan Rintisan AI yang Melatih Model Sendiri YC baru-baru ini memamerkan lebih dari 25 perusahaan rintisan yang mengesankan dari angkatannya yang telah bertahan dari pendekatan konvensional dengan berhasil melatih model AI mereka sendiri. Inisiatif ini menyoroti pergeseran penting dalam lanskap AI: membangun model AI menjadi lebih cepat, lebih murah, dan lebih mudah diakses daripada yang dibayangkan b

  • MineLand: Simulator Multi-Agen Minecraft yang Menjembatani Kesenjangan Simulasi Multi-Agen dengan Kompleksitas Dunia Nyata

    Pendahuluan Kecerdasan buatan (AI) telah mengalami kemajuan luar biasa dalam beberapa tahun terakhir, dengan para peneliti terus mendorong batas kemampuan mesin. Salah satu bidang yang mendapat perhatian signifikan adalah pengembangan simulator multi-agen, yang bertujuan untuk menciptakan lingkungan virtual tempat agen AI dapat berinteraksi satu sama lain dan dengan lingkungannya. Simulasi ini menawarkan kesempatan unik untuk mempelajari perilaku kolektif, dinamika sosial, dan munculnya sistem yang kompleks. Kesenjangan dalam Simulasi Multi-Agen Namun, banyak simulator multi-agen yang ada beroperasi dalam kondisi ideal, dengan asumsi informasi yang sempurna dan kemampuan yang tidak terbatas bagi agen yang terlibat. Kesenjangan dari kendala dunia nyata ini dapat membatasi validitas ekologis dan kekayaan interaksi yang diamati dalam lingkungan simulasi ini. MineLand: Menjembatani Kesenjangan Untuk menjembatani kesenjangan ini, para peneliti telah mengembangkan MineLand (ditunjukkan pada Gambar 2), simulator mul

  • Solusi Manajemen Media Terintegrasi Berbasis AI dari Axle AI dan Cloudian

    Pencarian Media Berbasis AI Pencarian media berbasis AI merupakan industri yang sedang berkembang pesat. Perusahaan media menggunakan kemampuan AI dan pembelajaran mendalam untuk melacak dan menganalisis percakapan daring guna meningkatkan hasil manajemen pengalaman pelanggan. Namun, keamanan dan tata kelola data mengalahkan sebagian besar pelanggan AI di industri pemasaran, sehingga menyebabkan anggaran yang meningkat dan hasil yang buruk. Solusi Terintegrasi Untuk mengatasi masalah ini, Cloudian dan Axle AI telah bersama-sama mengumumkan solusi manajemen media terintegrasi berbasis AI baru untuk lingkungan hibrida. Keduanya akan menggabungkan keahlian mereka dalam kinerja pencarian media dengan solusi danau data hibrida. Hal ini akan menghasilkan kedaulatan data yang lebih baik, pengurangan biaya TI, dan alur kerja media yang disederhanakan. Pengguna dapat menyimpan konten digital di tempat atau di cloud, mempertahankan manajemen satu titik dan pencarian media terpadu. Axle AI + Cloudian: Kekuatan Industri

  • Microsoft Luncurkan Langkah-langkah Pencegahan Penipuan Chatbot AI

    Tantangan Keamanan Chatbot AI Microsoft telah mengambil langkah untuk mengatasi tantangan keamanan yang dihadapi chatbot AI, seperti: Injeksi Prompt: Peretas dapat memanipulasi chatbot untuk melakukan tindakan yang tidak diinginkan. Halusinasi: Chatbot dapat menghasilkan tanggapan yang tidak akurat atau tidak berdasar. Fitur Keamanan Baru Untuk mengatasi tantangan ini, Microsoft telah memperkenalkan fitur keamanan baru untuk Azure AI, antara lain: Groundedness Detection: Mendeteksi tanggapan yang tidak akurat atau “halusinasi”. Prompt Shield: Mencegah injeksi prompt yang berbahaya. Evaluasi Keamanan: Menilai kerentanan aplikasi terhadap serangan jailbreak dan pembuatan konten berisiko. Peningkatan Alat Keamanan Selain fitur baru, Microsoft juga meningkatkan alat keamanannya, seperti: Pemantauan Real-Time: Mengidentifikasi dan memblokir konten atau pengguna yang menyinggung. Pengujian Stres Otomatis: Memastikan aplikasi AI tidak rentan terhadap jailbreak. Penyesuaian Filter Konten: Memungkinkan pengembang untu

  • OpenUI: Alat AI yang Membantu Pengembang Mendesain UI dengan Imajinasi

    Membangun komponen antarmuka pengguna (UI) untuk aplikasi sering kali membosankan. Banyak pengembang merasa membuat elemen UI memakan waktu, sehingga memperlambat proses pengembangan. Alat yang ada untuk membantu pengembangan UI mungkin tidak selalu menawarkan fleksibilitas dan kemudahan penggunaan yang diinginkan pengembang. Solusi Pengembangan UI yang Ada Solusi yang ada untuk membangun komponen UI meliputi kerangka kerja yang menyediakan pengembang dengan komponen dan pustaka yang telah dibuat sebelumnya untuk menyederhanakan pembuatan elemen UI. Namun, solusi ini mungkin memiliki kurva belajar dan keterbatasan dalam hal penyesuaian. OpenUI: Alat AI untuk Pengembangan UI OpenUI adalah proyek AI baru yang dirancang untuk mengubah cara pengembang membangun komponen UI. OpenUI bertujuan untuk membuat pengembangan UI menjadi pengalaman yang menyenangkan, cepat, dan fleksibel. Tim di W&B menggunakannya untuk menguji dan membuat prototipe perkakas generasi berikutnya untuk membangun aplikasi canggih di atas mode

  • Analisis AI: Dawn AI Ubah Permintaan Pengguna dan Output Model Jadi Metrik

    Aplikasi AI hadir di setiap bisnis, tak heran jika bidang ini sedang berkembang pesat. Meski begitu, masih ada tantangan besar: memahami interaksi model pengguna-AI dan kinerja model. Menilai komponen yang tidak jelas ini bisa jadi sulit, yang menghambat kemajuan dan pengalaman pengguna. Tantangan dalam Analisis AI Salah satu kendala utama kecerdasan buatan adalah sulitnya memperoleh wawasan yang berguna dari kumpulan data yang rumit dan besar. Istilah umum untuk ini adalah “masalah data”. Perusahaan mengumpulkan lebih banyak data dari sebelumnya, tetapi tidak semuanya memiliki sumber daya atau pengetahuan untuk mengevaluasinya dengan benar. Beberapa masalah dapat muncul karena ketidakjelasan ini. Bisnis memerlukan bantuan untuk mengidentifikasi masalah pelanggan, mengklasifikasikan tindakan pelanggan, dan menentukan alasan pelanggan pergi. Masalah lainnya adalah mempertimbangkan bias kerja ke dalam model, yang membutuhkan pekerjaan. Mengembangkan model AI yang lebih tepercaya dan tangguh adalah kendala lainn

  • KTT Adobe Summit 2024: 10 Poin Penting

    Hari Pertama Sesi utama hari pertama dibuka dengan sambutan CEO Adobe, Shantanu Narayen. Kemudian, beberapa pembicara dari Adobe dan mitra global Enterprise-level hadir di panggung. Hari Kedua Hari kedua menampilkan lokakarya informatif tentang fitur B2B mendatang yang akan dirilis akhir tahun ini. Peserta juga memperoleh wawasan berharga tentang Edge Delivery Services untuk Adobe Commerce melalui berbagai merek. Poin Utama Adobe Summit 2024 Storefront Adobe Commerce Memperkenalkan alat terbaru untuk menciptakan pengalaman etalase yang luar biasa. Drop-in memungkinkan pembuatan komponen frontend mikro tanpa server yang dapat diintegrasikan dengan lancar ke kerangka apa pun. Pelanggan Adobe Experience Manager (AEM) dapat memanfaatkan Edge Delivery Services (EDS) dan Document Based Authoring untuk memberikan pengalaman etalase yang lengkap secara efisien. Kemampuan B2B Baru B2B 1.5.0 dijadwalkan rilis pada musim panas ini. Fitur baru termasuk manajemen akun perusahaan induk/anak yang efisien, pembuatan dan modi

  • Dataverse: Solusi untuk Tantangan Pemrosesan Data pada Model Bahasa Besar

    Dengan masuknya model bahasa besar (LLM) di hampir semua bidang teknologi, pemrosesan kumpulan data besar untuk model bahasa menghadirkan tantangan dalam hal skalabilitas dan efisiensi. Masalah utamanya adalah tugas berat dalam mengelola, membersihkan, dan mengatur kumpulan data besar yang penting untuk melatih LLM yang canggih. Mengatasi tantangan ini memerlukan solusi yang skalabel, serbaguna, dan dapat diakses oleh berbagai pengguna, mulai dari peneliti individu hingga tim besar yang mengerjakan sisi terdepan pengembangan AI. Tantangan dalam Pemrosesan Data LLM Penelitian yang ada menekankan pentingnya pemrosesan terdistribusi dan kontrol kualitas data untuk meningkatkan LLM. Memanfaatkan kerangka kerja seperti Slurm dan Spark memungkinkan pengelolaan data besar yang efisien, sementara peningkatan kualitas data melalui deduplikasi, dekontaminasi, dan penyesuaian panjang kalimat memperbaiki kumpulan data pelatihan. Proses ETL (Ekstrak, Transformasi, Pemuatan) juga penting dalam menggabungkan dan memproses d

  • Integrasi AI dalam Tugas Web Otomatis: MultiOn Luncurkan API Agen dalam Beta Publik

    Pendahuluan Kecerdasan buatan (AI) terus mengubah cara kita berinteraksi dengan teknologi. MultiOn, perusahaan terkemuka dalam teknologi AI web, telah meluncurkan API Agen dalam beta publik. Ini menandai era baru dalam integrasi teknologi cerdas untuk bisnis dan pengembang. Fitur API Agen API Agen MultiOn memungkinkan pengembang untuk menyematkan agen AI dalam berbagai platform digital, termasuk perangkat pintar, aplikasi, situs web, dan solusi SaaS. Agen ini dirancang untuk menyelesaikan tugas dan menavigasi alur kerja di web secara mandiri, bertindak sebagai asisten yang menghadap pengguna atau beroperasi secara diam-diam di latar belakang pengalaman digital. Manfaat bagi Bisnis dan Pengembang API Agen MultiOn menawarkan manfaat yang signifikan bagi bisnis dan pengembang: Otomatisasi Tugas: Agen AI dapat mengotomatiskan tugas rutin, membebaskan waktu dan sumber daya untuk tugas yang lebih strategis. Peningkatan Pengalaman Pelanggan: Agen AI dapat memberikan bantuan dan dukungan waktu nyata kepada pengguna,

  • Toolkit Open-Source untuk Pengujian dan Eksperimentasi Prompt yang Mendukung LLM dan Basis Data Vektor

    Pengantar Menguji dan bereksperimen dengan model bahasa besar (LLM) dan basis data vektor seringkali menantang bagi individu dan tim kecil. Meskipun alat canggih ini penting untuk membangun aplikasi yang canggih, mengevaluasi kinerja dan kesesuaiannya dapat menjadi tugas yang menakutkan dan membutuhkan banyak sumber daya. Tantangan yang Dihadapi Beberapa sumber daya dan platform telah berupaya menjembatani kesenjangan ini, tetapi seringkali rumit, memerlukan pengaturan yang ekstensif, keahlian mendalam, atau investasi finansial yang besar. Hal ini membuat entitas yang lebih kecil dan pengembang independen berada pada posisi yang kurang menguntungkan, berjuang untuk menemukan cara yang mudah diakses dan langsung untuk mengevaluasi dan memilih teknologi yang tepat untuk proyek mereka. PromptTools: Solusi Inovatif PromptTools adalah toolkit open-source yang inovatif dan dapat dihosting sendiri yang dirancang khusus untuk menyederhanakan proses pengujian, eksperimentasi, dan evaluasi LLM dan basis data vektor. Fi

  • Evolusi RAG: RAG Naif, RAG Lanjutan, dan Arsitektur RAG Modular

    RAG Naif RAG Naif merupakan paradigma penelitian RAG paling awal, yang mulai populer setelah ChatGPT banyak diadopsi. RAG Naif mengikuti proses tradisional yang meliputi pengindeksan, pengambilan, dan pembuatan, yang juga disebut sebagai kerangka kerja “Ambil-Baca”. RAG Lanjutan RAG Lanjutan memperkenalkan penyempurnaan khusus untuk mengatasi keterbatasan RAG Naif. Dengan berfokus pada peningkatan kualitas pengambilan, RAG Lanjutan menggunakan strategi pra-pengambilan dan pasca-pengambilan. RAG Modular Arsitektur RAG Modular melangkah lebih maju dari dua paradigma RAG sebelumnya, menawarkan kemampuan beradaptasi dan keserbagunaan yang lebih baik. Arsitektur ini menggabungkan beragam strategi untuk meningkatkan komponennya, seperti menambahkan modul pencarian untuk pencarian kesamaan dan menyempurnakan pengambil melalui penyetelan halus. Modul Baru Kerangka kerja RAG Modular memperkenalkan komponen khusus tambahan untuk meningkatkan kemampuan pengambilan dan pemrosesan. Modul Pencarian beradaptasi dengan skena

  • Model AI Generatif SEEDS untuk Prakiraan Cuaca Jangka Menengah yang Lebih Akurat

    Pendahuluan Google AI memperkenalkan SEEDS untuk mengatasi tantangan dalam menghasilkan prakiraan cuaca ansambel yang akurat dan efisien secara komputasi. Metode saat ini bergantung pada simulasi berbasis fisika, yang intensif secara komputasi dan membatasi ukuran ansambel prakiraan, terutama untuk peristiwa cuaca langka dan ekstrem. Tantangan Prakiraan Cuaca Sifat cuaca yang tidak dapat diprediksi membuatnya penting untuk mengukur ketidakpastian dalam prakiraan, terutama karena perubahan iklim meningkatkan permintaan akan informasi cuaca yang andal. Model SEEDS Untuk mengatasi hal ini, peneliti Google mengusulkan SEEDS, model AI generatif berdasarkan model probabilistik difusi denoising. SEEDS secara efisien menghasilkan ansambel besar prakiraan cuaca dengan biaya yang lebih rendah dibandingkan metode tradisional, memungkinkan pengukuran ketidakpastian yang lebih baik dan prediksi peristiwa ekstrem yang lebih akurat. Manfaat SEEDS Menghasilkan ansambel prakiraan yang menyamai atau melampaui metrik keterampil

  • iOS 18: AI yang Menakjubkan

    iOS 18 siap mengantarkan era AI, mengubah iPhone atau iPad Anda menjadi benteng kecerdasan. Bayangkan sebuah sistem operasi yang sangat cerdik, seolah-olah mendahului setiap keinginan Anda. Anggap saja ini seperti asisten yang sangat kompeten, yang biasanya disediakan untuk tokoh-tokoh penting di film, kini menjadi entitas digital yang ada di saku Anda, terus mengasah kemampuannya untuk memenuhi kebutuhan Anda. Ini menandakan pergeseran monumental dalam ranah digital. Siri yang Semakin Bijaksana Menyelami ranah Siri, teman digital kita telah menempuh perjalanan panjang dan, memang, menghadapi keterbatasan. Bersiaplah untuk iOS 18, yang akan membawa metamorfosis Siri yang pasti mengejutkan. Antisipasi lompatan seismik, yang didorong oleh model bahasa besar canggih yang sama yang membuat teknologi seperti ChatGPT menjadi menakjubkan. Bayangkan Siri menguraikan dialog Anda dengan pemahaman yang bernuansa, membuat tanggapan yang tidak hanya membantu tetapi juga memancarkan kreativitas. Di luar tugas-tugas biasa,

  • Kemitraan Schneider Electric dan NVIDIA untuk Pusat Data AI

    Schneider Electric dan NVIDIA bermitra untuk meningkatkan infrastruktur pusat data dan mendorong inovasi dalam kecerdasan buatan (AI) tepi dan teknologi kembar digital. Desain Referensi Pusat Data AI yang Dapat Diakses Publik Pertama di Dunia Dengan pengetahuan luas Schneider Electric dalam infrastruktur pusat data dan teknologi AI mutakhir dari NVIDIA, mereka dengan bangga meluncurkan desain referensi pusat data AI yang dapat diakses publik pertama di dunia. Desain ini akan merevolusi penerapan dan pengoperasian AI dalam ekosistem pusat data, yang merupakan tonggak penting dalam kemajuan industri. Desain Cluster NVIDIA Mutakhir dari Schneider Electric Dengan munculnya AI, desain dan pengoperasian pusat data telah mengalami perubahan signifikan dan menjadi lebih kompleks. Operator pusat data sekarang fokus pada pembangunan dan pengelolaan fasilitas yang hemat energi dan dapat diskalakan, sekaligus memastikan stabilitas. Pada tahap awal kemitraan ini, Schneider Electric akan mengungkap desain referensi pusat d

  • Buku-Buku ChatGPT Terbaik untuk Dibaca di 2024

    Panduan Cepat Model Bahasa Besar: Strategi dan Praktik Terbaik untuk Menggunakan ChatGPT dan LLM Lainnya Buku ini membantu Anda memulai di bidang model bahasa besar. Buku ini menyediakan kode untuk bekerja dengan berbagai model, seperti GPT-4, BERT, T5, dll., dan menjelaskan cara kerjanya. Buku ini juga memberikan panduan untuk memanfaatkan dan menerapkan LLM untuk memecahkan masalah praktis. ChatGPT untuk Pemula Buku ini menjelaskan dasar-dasar dan teknologi di balik ChatGPT dan kasus penggunaan inovatifnya di berbagai bidang. Penulis mengeksplorasi bagaimana kita dapat menggunakan model dalam pembuatan konten, pembuatan ide, dan pemecahan masalah kompleks. ChatGPT untuk Dummies “ChatGPT untuk Dummies” menjelaskan cara kerja ChatGPT dan bagaimana kita dapat menggunakannya untuk keuntungan kita. Buku ini juga mengajarkan cara menulis petunjuk untuk hasil yang lebih baik. Kode Pembisik AI Buku ini menyoroti area di mana kita dapat memanfaatkan AI dan ChatGPT untuk mendapatkan keunggulan kompetitif. Penulis men

  • LUMOS: Kerangka Pelatihan Agen Bahasa Terbuka dan Umum

    Bayangkan memiliki asisten digital yang tidak hanya dapat menjawab pertanyaan Anda, tetapi juga menavigasi web, menyelesaikan soal matematika yang rumit, menulis kode, dan bahkan bernalar tentang gambar dan permainan berbasis teks. Kedengarannya terlalu bagus untuk menjadi kenyataan? Nah, bersiaplah karena masa depan kecerdasan buatan baru saja menjadi jauh lebih mudah diakses dan transparan dengan diperkenalkannya LUMOS. Dalam perkembangan yang inovatif, para peneliti dari Allen Institute for AI, UCLA, dan University of Washington telah meluncurkan LUMOS, sebuah kerangka kerja sumber terbuka yang menjanjikan untuk merevolusi cara kita berinteraksi dengan agen bahasa. Tidak seperti solusi sumber tertutup yang ada yang sering terasa seperti kotak hitam, LUMOS menawarkan tingkat keterjangkauan, transparansi, dan reproduktifitas yang belum pernah terjadi sebelumnya, menjadikannya pengubah permainan di dunia AI. Tetapi apa sebenarnya LUMOS, dan mengapa hal itu menyebabkan kehebohan di komunitas AI? Bersiaplah, ka

  • Mengajarkan SOLAR untuk Bersinar: Bagaimana sDPO dari Upstage AI Menyelaraskan Model Bahasa dengan Nilai-Nilai Manusia

    Pengantar Bayangkan memiliki asisten AI super cerdas yang tidak hanya memiliki pengetahuan luas, tetapi juga memahami dan menghormati nilai-nilai, etika, dan preferensi Anda. Sebuah tim peneliti mungkin telah memecahkan kode untuk menjadikan fantasi fiksi ilmiah ini menjadi kenyataan. sDPO: Menyelaraskan Model Bahasa dengan Nilai-Nilai Manusia Para peneliti di Upstage AI telah mengembangkan teknik inovatif yang disebut “stepwise Direct Preference Optimization” (sDPO). sDPO adalah cara cerdik untuk menyelaraskan model bahasa besar dengan nilai-nilai dan preferensi manusia. sDPO menggunakan proses pembelajaran bergaya kurikulum untuk secara bertahap menanamkan preferensi manusia ke dalam model. Pertama, peneliti mengumpulkan data yang menangkap preferensi manusia tentang apa yang merupakan respons baik vs. buruk terhadap pertanyaan. Data ini kemudian dibagi menjadi beberapa bagian. Pada fase pertama, model AI dilatih pada bagian pertama sambil menggunakan dirinya sendiri yang asli dan tidak disempurnakan sebaga

  • Mojo: Bahasa Pemrograman yang Mengubah Python Menjadi Monster

    Di dunia teknologi dan kecerdasan buatan yang berkembang pesat, muncul sebuah perkembangan baru yang menjanjikan dampak signifikan pada komunitas Python dan AI. Modular, sebuah perusahaan teknologi perintis, telah mengumumkan sumber terbuka Mojo, sebuah bahasa pemrograman yang dirancang untuk meningkatkan kemampuan Python, memungkinkan pengembang menulis kode yang berskala “sampai ke kode metal.” Langkah ini akan mengubah pemrograman Python, menawarkan kecepatan dan efisiensi yang belum pernah terjadi sebelumnya. Sumber Terbuka Mojo Modular telah lama memperjuangkan prinsip-prinsip sumber terbuka, dan rilis Mojo di bawah lisensi Apache 2 merupakan langkah signifikan menuju pemenuhan visinya. Sejak rilis awal pada Mei 2023, Mojo telah mengalami peningkatan yang stabil, dengan tim Modular berkomitmen untuk mengembangkan bahasa tersebut bekerja sama dengan pengembang di seluruh dunia. Ekosistem Pengembang Modular tidak asing dengan proyek sumber terbuka yang sukses, telah berkontribusi pada LLVM, Swift, TensorFl

  • Deep-Seek: Agen Riset Sumber Terbuka untuk Mesin Penelusuran Skala Internet

    Internet dipenuhi dengan informasi, tetapi mengonsolidasikan data ini menjadi ikhtisar yang jelas, terorganisir, dan komprehensif membutuhkan banyak pekerjaan. Hal ini sering kali menyebabkan frustrasi dan pemborosan waktu bagi mereka yang mencari jawaban. Mesin penjawab telah menjadi solusi yang tepat untuk dilema seperti itu. Platform ini menggabungkan banyak sumber untuk menyajikan satu jawaban pasti untuk sebuah pertanyaan. Namun, mesin ini sering kali gagal menjawab pertanyaan yang lebih bernuansa yang membutuhkan spektrum data yang lebih luas dari berbagai sumber. Mereka tidak dirancang untuk menyusun daftar opsi atau solusi yang terperinci, sehingga memberikan informasi yang tidak lengkap kepada pengguna. Di sinilah Deep-Seek hadir, menawarkan solusi revolusioner untuk masalah ini. Tidak seperti mesin penjawab tradisional yang berfokus pada penentuan jawaban yang benar, Deep-Seek beroperasi sebagai mesin penelusuran. Fungsi utamanya adalah menyaring banyak sumber, menyusun daftar entitas yang komprehen

  • Jaringan OA-CNN: Keluarga Jaringan yang Mengintegrasikan Modul Ringan untuk Sangat Meningkatkan Kemampuan Adaptasi Jaringan Saraf Konvolusional Jarang (CNN) dengan Biaya Komputasi Minimal

    Pengantar Dalam bidang pemahaman adegan 3D, tantangan signifikan muncul dari sifat awan titik 3D yang tidak beraturan dan tersebar, yang sangat berbeda dari piksel yang tersusun rapat dan seragam dalam gambar. Untuk mengatasi hal ini, berbagai metode ekstraksi fitur telah muncul: jaringan berbasis titik dan jaringan saraf konvolusional jarang (CNN). Jaringan berbasis titik menganjurkan manipulasi titik yang tidak terstruktur secara langsung, sementara CNN jarang mengubah awan titik tidak beraturan menjadi voxel selama prapemrosesan data, memanfaatkan manfaat yang terstruktur secara lokal. Namun, terlepas dari nilai praktisnya, jaringan saraf konvolusional jarang (CNN) sering kali menunjukkan akurasi yang lebih rendah dibandingkan dengan rekan-rekan berbasis transformator, terutama dalam segmentasi semantik adegan 3D. Memahami alasan yang mendasari kesenjangan kinerja ini sangat penting untuk memajukan kemampuan CNN jarang. Inovasi OA-CNN Dalam studi baru-baru ini, para peneliti telah menyelidiki perbedaan int

  • Optimasi Model Bahasa Besar: Algoritma LISA

    Pengantar Model bahasa besar (LLM) seperti ChatGPT unggul dalam tugas-tugas seperti membuat dokumen, mengembangkan kode kompleks, menjawab pertanyaan, dan melakukan percakapan seperti manusia. Penyetelan halus LLM untuk domain tertentu menjadi strategi penting untuk meningkatkan kemampuannya. Namun, teknologi ini sangat mahal, sehingga sulit untuk membangun model dalam skala besar. Metode Penyetelan Halus yang Efisien Metode penyetelan halus yang efisien (PEFT) telah diusulkan untuk meminimalkan jumlah parameter yang dapat dilatih dan mengurangi biaya. Metode ini meliputi bobot adaptor, bobot prompt, dan LoRA. LoRA dan Keterbatasannya Di antara metode PEFT, LoRA adalah salah satu yang paling banyak diadopsi. Namun, LoRA masih memiliki beberapa keterbatasan dalam bersaing dengan penyetelan halus parameter penuh dalam semua skenario. Misalnya, ada kekhawatiran tentang efektivitas LoRA pada kumpulan data berskala besar karena sering gagal selama pra-pelatihan berkelanjutan. LISA: Menjembatani Kesenjangan Untuk m

arrow_drop_down

ブログリーダー」を活用して、hiromiさんをフォローしませんか?

ハンドル名
hiromiさん
ブログタイトル
セラミドコスメのオススメ
フォロー
セラミドコスメのオススメ

にほんブログ村 カテゴリー一覧

商用