MİT birlikte çalışan bilim insanları Google DerinZihin araştırmacılar bir geliştirdiler yapay zekagüdümlü robot Basit metin açıklamalarına dayalı olarak ‘fikirleri fiziksel nesnelere dönüştürebilen’.
Araştırmacılar, robotlarının aynı zamanda inşaat sırasında nihai nesnenin amaçlanan kullanımını da tahmin edebildiğini, bu sayede doğruluğu artırdığını ve azaltıldığını söylüyor. üretme hatalar.
Sistemin mevcut sürümü masa ve sandalye gibi daha basit nesnelerle sınırlı olsa da ekip, robotun işlevselliğini genişletmeyi ve böylece eklemler, menteşeler ve diğer hareketli parçalara sahip prototipler de dahil olmak üzere daha karmaşık nesneler oluşturabilmeyi umuyor.
Araştırma ekibi, ticari olarak piyasaya sunulduğunda, kendi yaklaşımlarına dayanan yapay zeka destekli bir robot montaj sisteminin, doğrudan tüketicinin evinde karmaşık nesneler yaratabileceğine, üretim, montaj, depolama ve nakliye maliyetlerini azaltabileceğine ve hatta ortadan kaldırabileceğine inanıyor.
Ekibin çalışmasını detaylandıran bir makalenin kıdemli yazarı olan MIT profesörü Randall Davis, “Fikirleri hızlı, erişilebilir ve sürdürülebilir bir şekilde fiziksel nesnelere dönüştürmek için üretken yapay zeka ve robot bilimini kullanabileceğimizi gösterdik” diye açıkladı.
Araştırmacılardan yapılan açıklamaya göre amaç, uygulamanın sunduğu kullanım kolaylığını bir araya getirmekti. üretken yapay zeka modelleri Kullanıcının ilk istemine dayalı olarak tasarımın doğru bir prototipini hızla oluşturup bir araya getiren robotik yetenekle basit metin istemlerini karmaşık tasarımlara dönüştürebilen.
MIT liderliğindeki ekip, başlamak için bir vizyon-dil modeli (VLM) görüntüleri ve metni anlamak için önceden eğitildi. İlk prototip için, bu VLM’ye istenen nesneyi oluşturmak için yalnızca iki tip prefabrik parçayı (yapısal bileşenler ve panel bileşenleri) kullanma görevi verildi.
Ekibin çalışmasını ayrıntılarıyla anlatan bir makalenin baş yazarı ve MIT Elektrik Mühendisliği ve Bilgisayar Bilimleri (EECS) ve Mimarlık bölümlerinde yüksek lisans öğrencisi olan Alex Kyaw, panelleri fiziksel bir nesne üzerine yerleştirmenin birçok yolu olduğunu açıkladı. Bununla birlikte, üretken bir yapay zeka metin isteminden bir nesne oluşturmak için robotun, her bir bileşenin yerleşimi hakkında nihai bir karar vermeden önce “geometriyi görmesi ve bu geometri üzerinde mantık yürütmesi” gerekir.
Kyaw, “Robotun hem gözü hem de beyni olarak hizmet veren VLM, robotun bunu yapmasını sağlıyor” diye açıkladı.
Örneğin, bir kullanıcı “bana bir sandalye yap” gibi basit bir inşaat görevi yazdığında sistem önce bir sandalyenin yapay zeka görüntüsünü oluşturur. Daha sonra, istenen nesnenin nihai işlevselliğine bağlı olarak panel bileşenlerinin yapısal bileşenlerin üzerine nereye yerleştirileceğini (veya yerleştirilmeyeceğini) belirlemek için sandalyeyle ilgili özel olarak programlanmış VLM “nedenleri”.

Ekibe göre, yapay zeka destekli robot prototipleme sisteminin gösterim versiyonu, kararlarını “koltuk” veya “arkalık” gibi metinler halinde çıkarıyor ve ardından bölümleri numaralandırıyor. Bu numaralandırılmış tasarım, bileşenlere sandalyenin ‘sırt’ veya ‘koltuk’ gibi panel gerektiren kısımlarına karşılık gelen adların atandığı VLM’ye geri beslenir.
Sonuç olarak, yapay zeka destekli robotik inşaat işçilerinin gelişmiş tasarımı, basitçe sandalye şeklinde bir nesne oluşturmak yerine, sırt dayanağı ve koltuğun oturmayı mümkün kılmak için panellere ihtiyaç duyduğunu, ancak diğer yüzeylerin buna ihtiyacı olmadığını kendi başına belirliyor. Araştırmacılar sistemlerinden panel konumu seçimlerini açıklamalarını istediklerinde ekip, bu karmaşık sürecin aslında doğru olduğunu doğruladıklarını söyledi.
Kyaw, “Görme dili modelinin, bir sandalyenin yaslanma ve oturma gibi işlevsel yönlerini bir dereceye kadar anlayabildiğini ve panellerin neden koltuğa ve sırtlığa yerleştirildiğini anlayabildiğini öğrendik” diye açıkladı. “Bu sadece bu görevleri rastgele dağıtmak değil.”
Yapay zeka destekli robotun mevcut tanıtım sürümü, ilk metin isteminden sonra basit inşaat görevlerini tamamlayabilse de, yine de döngüde bir insan kullanıcıyla çalışacak şekilde tasarlandı. Ekip, bunun kullanıcıya yol boyunca yeni istemler sunarak “süreci hassaslaştırmasına” olanak tanıdığını söyledi.

Kyaw, “Tasarım alanı çok büyük, bu nedenle kullanıcı geri bildirimleriyle alanı daraltıyoruz” diye açıkladı. “Bunu yapmanın en iyi yolunun bu olduğuna inanıyoruz çünkü insanların farklı tercihleri var ve herkes için idealleştirilmiş bir model oluşturmak imkansız olurdu.”
MIT mimarlık yüksek lisans öğrencisi ve çalışmanın ortak yazarı Richa Gupta da bu görüşe katılıyor ve bu ‘döngüdeki insan’ sürecinin, kullanıcıların yapay zeka tarafından oluşturulan tasarımları yönlendirmesine ve nihai üründe “sahiplik duygusuna sahip olmasına” olanak tanıdığını belirtiyor.
Daha sonra ekip, yapay zeka destekli robot sistemini, metal ve cam gibi farklı malzemelerden bir masa oluşturma görevi vermek gibi daha karmaşık ve incelikli metin istemlerini yönetebilecek şekilde geliştirmeyi umduklarını söyledi. Ekip aynı zamanda fikirleri daha fazla işlevselliğe sahip fiziksel nesnelere dönüştürmek için robotun bir prototipe dahil edebileceği “dişliler, menteşeler veya diğer hareketli parçalar gibi” prefabrik bileşen yelpazesini genişletmeyi de istediklerini söyledi.
Yapay zeka destekli robot sistemlerinin olası uygulamalarını tartışırken araştırmacılar, yaklaşımlarının mimariden havacılığa kadar çok farklı alanlarda kullanılan hızlı prototipleme bileşenleri için “özellikle yararlı” olabileceğini söyledi. Ayrıca tasarımlarının, “hacimli ürünlerin merkezi bir tesisten gönderilmesine gerek kalmadan” mobilya veya diğer nesneleri yerel olarak üretebilen ev tabanlı bir sistemi mümkün kılabileceğini öne sürüyorlar.
Henüz prototip aşamasında olan Kyaw, nihai hedefin, farklı üretim sistemi kategorilerine uygulanabilecek, insanların tasarımlarını daha doğal bir şekilde iletmesine olanak tanıyan uyarlanabilir, yapay zeka destekli bir robotik platformu tasarlamak olduğunu söyledi.
MIT bilim insanı, “Er ya da geç, bir şeyleri birlikte yapmak için birbirimizle konuştuğumuz gibi, bir robot ve yapay zeka sistemiyle de iletişim kurabilmek ve konuşabilmek istiyoruz” diye açıkladı. “Sistemimiz bu geleceği mümkün kılmaya yönelik ilk adımdır.”
Kağıt “3D Üretken Yapay Zeka ve Görme Dili Modellerini Kullanarak Çok Bileşenli Nesnelerin Robotik Montajına Metin Dönüştürme” yakın zamanda sunuldu Sinir Bilgi İşleme Sistemleri Konferansı.
Christopher Plain, Bilim Kurgu ve Fantazi roman yazarı ve The Debrief’te Baş Bilim Yazarıdır. Onu takip edin ve onunla bağlantı kurun X, onun kitapları hakkında bilgi edinin plainfiction.comveya doğrudan şu adrese e-posta gönderin: [email protected].







