Bagaimana bidikan terdalam penguji Roomba berakhir di Fb

Bagaimana bidikan terdalam penguji Roomba berakhir di Fb

Investigasi terhadap data pelatihan—bocor dari properti interior di seluruh dunia.

Bagaimana bidikan terdalam penguji Roomba berakhir di Fb - anaglyph vacuum 169 image 1

Stephanie Arnett/MITTR

Seorang Roomba merekam seorang gadis di kamar kecil. Bagaimana tangkapan layar dijeda di media sosial?

Episode ini kami berjalan dengan susah payah di bagian belakang layar investigasi Evaluasi Teknologi MIT yang mengungkap betapa bagusnya bidikan yang diambil oleh pegangan vakum bertenaga AI telah bocor dan mendarat di skor.

Pelaporan:

  • Seorang Roomba merekam seorang gadis di kamar kecil. Bagaimana tangkapan layar dijeda di Fb?
  • Penguji Roomba merasa disesatkan setelah foto mesra berakhir di Facebook

Kita bertemu:

  • Eileen Guo, Evaluasi Teknologi MIT
  • Albert Fox Cahn, Proyek Pengawasan Teknologi Pengawasan

Nilai kredit:

Episode ini pernah dilaporkan oleh Eileen Guo dan diproduksi oleh Emma Cillekens dan Anthony Green. Itu dipandu oleh Jennifer Solid dan diedit oleh Amanda Silverman dan Mat Honan. Pertunjukan ini dipadukan oleh Garret Lang dengan lagu otentik dari Garret Lang dan Jacob Gorski. Karya seni oleh Stephanie Arnett.

Transkrip gemuk:

[TR ID]

Jennifer: Karena semakin banyak pilihan perusahaan memisahkan kecerdasan sintetis ke dalam produk mereka, mereka menginginkan data untuk melatih sistem mereka.

Dan dalam banyak kasus kami tidak tahu dari mana data itu berasal.

Namun seringkali secara faktual dengan menggunakan suatu produk, sebuah organisasi menganggap itu sebagai persetujuan untuk menggunakan data kami untuk menyempurnakan layanan dan produknya.

Memiliki gadget di apartemen, di mana lingkungannya melibatkan satu orang faktual yang menyetujui atas nama setiap orang yang masuk… dan tinggal di sana — atau kunjungan faktual — mungkin juga akan direkam tanpa disadari.

Saya Jennifer Solid dan episode ini kami mengangkat Anda investigasi Analisis Teknologi tentang data pelatihan… yang pernah bocor dari properti interior di seluruh dunia.

[SHOW ID]

Jennifer: Satu tahun lalu seseorang menghubungi seorang reporter yang bekerja dengan saya… dan menandai beberapa foto cantik yang telah mengambang di sekitar skor.

Eileen Guo: Mereka pasti tidak diragukan lagi, foto-foto dari properti orang-orang interior yang ditangkap dari sudut rendah, jarang ada orang dan hewan di dalamnya yang tampaknya tidak ditangkap yang mereka pegang direkam dalam banyak kasus.

Jennifer: Itu reporter investigasi Eileen Guo.

Dan konsisten dengan apa yang dia lihat… dia pikir bidikan mungkin juga ingin diambil oleh penyedot debu bertenaga AI.

Eileen Guo: Mereka terlihat seperti cinta, Anda tahu, mereka diambil dari tingkat dasar dan mengarah ke atas sehingga Anda mungkin juga akan melihat seluruh ruangan, langit-langit, siapa pun yang kebetulan berada di dalamnya…

Jennifer: Jadi dia memutuskan untuk bekerja menyelidiki. Butuh waktu berbulan-bulan.

Eileen Guo: Jadi pertama-tama kami harus memverifikasi apakah itu berasal dari penyedot debu robotik atau tidak, seperti yang kami duga. Dan dari sana, kami juga harus mengurangi dari mana robot vakum itu berasal. Dan apa yang kami temukan adalah segera setelah mereka berasal dari pabrikan utama, dengan preferensi penjualan kotor robot vakum mana pun, yaitu iRobot, yang memproduksi Roomba.

Jennifer: Itu menimbulkan pertanyaan tentang apakah tembakan ini membuat marah tentang persetujuan… dan bagaimana mereka merusak skor.

Tidak diragukan lagi salah satu dari mereka, seorang gadis sedang duduk di toilet.

Jadi kolega kami memeriksanya, dan dia menemukan foto itu bukan dari pembeli… mereka sebenarnya adalah karyawan Roomba… dan orang-orang yang disebut perusahaan sebagai ‘pengumpul data berbayar’.

Dengan kata lain, orang-orang dalam bidikan tersebut telah menjadi penguji beta… mereka biasanya setuju untuk mengambil bagian dari arah ini… meskipun tidak sepenuhnya jelas apa artinya itu.

Eileen Guo: Mereka sebenarnya tidak sejelas yang mungkin Anda mungkin akan mempertimbangkan untuk apa data digunakan secara tidak langsung, dengan siapa data itu dibagikan dan berbagai protokol atau prosedur apa yang akan menjaganya tetap aman — berbagai macam daripada pengamatan yang sangat besar bahwa data ini pasti akan aman.

Jennifer: Dia tidak memperhitungkan orang-orang yang memberikan izin untuk direkam, sebenarnya tahu apa yang mereka setujui.

Eileen Guo: Mereka mengerti bahwa penyedot debu robot mungkin akan mengambil video dari dalam rumah mereka, tetapi mereka tidak memperhitungkan bahwa, Anda tahu, mereka kemudian akan diberi label dan dilihat oleh manusia atau mereka tidak memperhitungkan bahwa mereka mungkin akan dibagikan dengan acara ketiga di luar negara. Dan tidak ada yang mengerti bahwa ada kemungkinan dalam setiap kekaguman bahwa bidikan ini mungkin juga berhenti di Facebook dan Discord, begitulah cara mereka secara tidak langsung sampai kepada kami.

Jennifer: Investigasi menemukan tangkapan gambar ini telah dibocorkan oleh beberapa pelabel data dalam ekonomi pertunjukan.

Saat itu mereka bekerja untuk perusahaan pelabelan data (disewa oleh iRobot) bernama Scale AI.

Eileen Guo: Atau tidak diragukan lagi, tidak diragukan lagi, karyawan bergaji sangat rendah yang diminta untuk menandai tembakan untuk mendidik kecerdasan sintetis cara yang tepat untuk mengenali apa yang mereka lihat. Jadi fakta bahwa tangkapan ini dibagikan pada skor, menjadi sangat luar biasa, mengingat betapa luar biasa mengingat betapa mulianya genggaman itu.

Jennifer: Memberi label pada bidikan ini dengan tag yang relevan dikenal sebagai anotasi data.

Arah membuatnya lebih mudah bagi komputer untuk mengenali dan memperjelas data dalam bentuk bidikan, derit tekstual, audio, atau video.

Dan itu digunakan dalam segala hal mulai dari pekikan bejat yang lesu di media sosial hingga membantu penyedot debu robot mengenali apa yang ada di sekitar mereka.

HOT 🔥  Unduhan: solusi tentang cara mematikan, dan plot yang meneruskan kekuasaan

Eileen Guo: Tidak diragukan lagi, kumpulan data yang paling berguna untuk melatih algoritme sebagian besar adalah yang paling masuk akal, artinya bersumber dari lingkungan yang sebenarnya. Tetapi untuk menemukan semua data itu benar-benar berguna untuk pembelajaran mesin, Anda benar-benar ingin seseorang berjuang melalui dan menyadari apa pun itu, atau mendengarkan apa pun itu, dan mengkategorikan dan menandai dan menambahkan konteks secara faktual ke setiap bagian data. . Tahukah Anda, untuk kendaraan yang digunakan sendiri, itu adalah pernyataan jalan dan menyatakan, itu adalah lampu lalu lintas yang berwarna kuning, itu adalah lampu lalu lintas yang berwarna hijau. Itu adalah tanda berhenti.

Jennifer: Tapi ada lebih dari satu cara untuk menandai data.

Eileen Guo: Jika iRobot memilih untuk, mereka mungkin juga akan pergi dengan berbagai perangkat yang datanya akan lebih aman. Mereka mungkin juga akan pergi dengan perusahaan outsourcing yang mungkin juga akan di-outsourcing-kan, namun orang-orang tidak mengetahui kantor sebagai alternatif di komputer keuntungan mereka. Jadi arah kerja mereka mungkin akan sedikit lebih terkontrol. Atau mereka mungkin juga hanya memahami anotasi data yang benar-benar dilakukan di rumah. Tetapi untuk alasan apa pun, iRobot memilih untuk tidak melewati salah satu rute ini.

Jennifer: Ketika Tech Review menghubungi perusahaan — yang membuat Roomba — mereka mengonfirmasi bahwa 15 bidikan yang telah kami bicarakan memang berasal dari perangkat mereka, tetapi dari perangkat praproduksi. Kemampuan apa yang mesin ini tidak diluncurkan ke pembeli.

Eileen Guo: Mereka menyebutkan bahwa mereka memulai penyelidikan tentang bagaimana tembakan ini bocor. Mereka mengakhiri kontrak mereka dengan Scale AI, dan juga menyebutkan bahwa mereka telah mengambil langkah-langkah untuk mencegah waktu luang ini turun dalam waktu dekat. Tapi mereka sebenarnya tidak akan menyatakan kita apa yang seharusnya.

Jennifer: Saat ini, sebagian besar penyedot debu robot yang paling canggih dapat secara efisien melewati ruangan sambil juga membuat peta area yang sedang dibersihkan.

Selain itu, mereka mengenali benda bening di bagian bawah dan memahami cara darinya.

Itu sebabnya mesin-mesin ini tidak lagi beroperasi melalui kekacauan yang jelas… suka kotoran anjing sebagai contoh.

Tapi apa yang berbeda dari jepretan latihan yang bocor ini adalah kameranya tidak mengarah ke bawah…

Eileen Guo: Mengapa mengarang titik kamera ini secara diagonal ke atas? Mengapa membuat mereka tahu apa yang ada di dinding atau langit-langit? Bagaimana lagi mereka menavigasi melalui kotoran hewan peliharaan, atau kabel telepon atau kaus kaki yang tersesat atau apa pun itu. Dan itu harus dibangun dengan beberapa impian yang lebih luas yang dimiliki iRobot dan berbagai perusahaan vakum robot untuk masa depan, yaitu agar Anda dapat mengetahui di ruangan mana itu berada, sesuai dengan apa yang kemungkinan besar akan Anda lakukan. bahkan pegang di rumah. Dan semua itu secara tidak langsung akan mewujudkan impian yang lebih luas dari perusahaan-perusahaan ini yang menghasilkan lebih banyak robot untuk rumah dan semua data ini secara tidak langsung membantu mereka mencapai impian tersebut.

Jennifer: Dengan berbagai macam kata… Urutan data ini mungkin mungkin juga hanya tentang membangun produk baru sama sekali.

Eileen Guo: Bidikan ini tidak lagi faktual tentang iRobot. Mereka tidak lagi faktual tentang melihat pelanggan. Atau bukan lagi rantai pasokan data total ini, dan titik baru total ini di mana data terdalam dapat bocor sehingga konsumen tidak benar-benar memikirkan atau memperhatikan. Dan hal yang juga memprovokasi hal itu adalah karena semakin banyak perusahaan yang mengadopsi kecerdasan sintetis, mereka membutuhkan lebih banyak data untuk melatih kecerdasan sintetis tersebut. Dan dari mana data itu berasal? Is.. adalah data pencarian yang sangat besar dari.

Jennifer: Karena di AS, perusahaan tidak diharuskan untuk mengungkapkannya… dan kebijakan privasi secara umum memahami beberapa versi dari garis yang memungkinkan data pembeli untuk berolahraga untuk meningkatkan layanan dan produk… Yang melibatkan pelatihan AI. Secara keseluruhan, kami memutuskan hanya dengan menggunakan produk.

Eileen Guo: Jadi tidak masalah bahkan tidak jelas bahwa itu adalah cetak biru lain di mana kita harus malu-malu tentang privasi, baik itu penyedot debu robotik, atau Zoom atau hiburan yang akan mengumpulkan informasi dari kita.

Jennifer: Salah satu opsi yang kami minta untuk dipahami lebih lanjut di beberapa titik segera… adalah penggunaan data sintetis… atau data yang tidak datang langsung dari orang-orang yang sebenarnya.

Dan dia mengatakan perusahaan yang menyukai Dyson mulai menerapkannya.

Eileen Guo: Mungkin ada harapan berbeda bahwa data sintetik adalah masa depan. Ini lebih menjaga privasi karena Anda tidak lagi membutuhkan data dunia yang akurat. Ada pemahaman perbandingan awal yang berarti bahwa itu faktual seindah jika tidak lagi. Tetapi sebagian besar ahli yang saya ajak bicara mengatakan bahwa ini terjadi di mana saja dari cinta 10 tahun hingga hanya beberapa waktu istirahat yang lama.

Jennifer: Anda mungkin juga bisa mendapatkan tautan ke pelaporan kami di catatan acara… dan juga kemungkinan besar Anda mungkin akan meningkatkan jurnalisme kami dengan mengunjungi ulasan teknologi dot com berlangganan.

Kami akan kembali… cantik setelah ini.

[MIDROLL]

Albert Fox Cahn: Saya berspesialisasi dalam hal itu hanyalah nama lain yang diharapkan oleh regulator dan legislator untuk benar-benar memberlakukan manfaat perlindungan privasi yang kita inginkan.

HOT 🔥  Industri mineral AS sedang booming. Inilah alasannya.

Albert Fox Cahn: Perusahaan saya Albert Fox Cahn. Saya Direktur Eksekutif Proyek Pengawasan Teknologi Pengawasan.

Albert Fox Cahn: Nyata sekarang ini adalah Wild West dan perusahaan kurang lebih membuat kebijakan keuntungan mereka saat mereka berjalan dengan susah payah untuk apa yang dianggap sebagai kebijakan etis untuk bentuk perbandingan dan mode ini, dan, Anda tahu, terus terang, mereka harus selalu tanpa suara. tidak lagi dipercaya untuk menempatkan prinsip dasar keuntungan mereka dan kami melihat dengan tepat mengapa dengan keuntungan bencana ini, karena di sini kemungkinan besar Anda akan benar-benar memahami sebuah organisasi n membuat karyawan keuntungannya menandatangani perjanjian persetujuan yang menggelikan ini yang faktualnya benar-benar miring. Apakah, menurut pencarian saya, sangat terkontaminasi sehingga mungkin juga tidak dapat diterapkan selama pemerintah. secara de facto mengambil kemampuan lepas tangan tentang keuntungan apa yang diinginkan dari keamanan privasi dalam cetak biru.

Jennifer: Dia adalah seorang pengacara anti-pengawasan… seorang rekan di Yale dan dengan Harvard’s Kennedy College.

Dan dia menggambarkan pekerjaannya sebagai berulang kali berjuang melawan metode baru yang akan diambil atau digunakan data orang untuk melawan mereka.

Albert Fox Cahn: Apa yang kami lihat di sini adalah istilah yang dirancang untuk memberikan perlindungan terhadap privasi produk, yang dirancang untuk memberikan perlindungan terhadap kekayaan intelektual iRobot, tetapi sebenarnya tidak ada perlindungan apa pun karena tertarik pada orang-orang yang memahaminya. perangkat di rumah mereka. Tampak nyata salah satu hal yang benar-benar menyebalkan bagi saya tentang hal itu adalah kemungkinan Anda bahkan mungkin akan mengenal orang-orang yang menggunakan alat-alat ini di rumah-rumah di mana hampir jelas bahwa pertemuan sosial ketiga akan direkam. dan tidak ada ketentuan untuk persetujuan dari arisan ketiga itu. Satu orang menandatangani untuk setiap orang yang tinggal di rumah itu, yang mengunjungi rumah itu, yang jepretannya mungkin juga direkam dari seluruh rumah. Dan juga, kemungkinan besar Anda bahkan mungkin akan memahami semua fiksi indah ini di sini cinta, oh, saya jamin tidak ada anak di bawah umur yang pasti akan dicatat sebagai setengah dari ini. Meskipun seperti yang diketahui semua orang, tidak ada ketentuan yang tepat untuk menjelaskan bahwa orang tidak melakukan ini di rumah di mana ada anak-anak.

Jennifer: Dan di AS, siapa pun dapat bertaruh bagaimana data ini kemungkinan besar akan ditangani.

Albert Fox Cahn: Bahkan saat Anda meninjau ini ke skenario yang sekarang kita pahami di Eropa di mana Anda benar-benar memahami, Anda tahu, undang-undang privasi yang komprehensif di mana kemungkinan besar Anda bahkan mungkin akan memahami, Anda tahu, lembaga penegak hukum dan regulator yang kuat yang berulang kali mendorong kembali cara perusahaan berperilaku. Dan kemungkinan besar Anda bahkan mungkin akan menemukan serikat pekerja alternatif yang kuat yang mungkin akan mencegah keuntungan dari rezim percobaan dengan karyawan di semua kesempatan. Anda tahu, itu siang dan malam.

Jennifer: Dia mengatakan memiliki karyawan yang bekerja sebagai penguji beta bermasalah… karena mereka mungkin juga tidak lagi merasa senang karena mereka memiliki preferensi.

Albert Fox Cahn: Kenyataannya adalah bahwa ketika Anda adalah seorang karyawan, seringkali Anda tidak lagi memiliki kemampuan untuk menyetujui secara berarti. Anda seringkali tidak bisa mengartikulasikan tidak. Dan sebagai alternatif sukarela, Anda secara sukarela mengangkat produk ini ke dalam cetak biru Anda, untuk mendapatkan data Anda. Dan agar Anda menginginkan dinamika koersif ini di mana saya faktual fabrikasi tidak lagi berspesialisasi dalam, Anda tahu, pada, pada, dari sudut pandang filosofis, dari sudut pandang etika, bahwa itu pasti Anda ‘ Saya akan memahami persetujuan yang berarti untuk perolehan program uji coba invasif ini oleh siapa saja yang memiliki hubungan kerja dengan individu yang, Anda tahu, membuat produk.

Jennifer: Perangkat kami sudah menampilkan layar data kami… dari smartphone hingga mesin cuci.

Dan itu hanya akan semakin disukai karena AI akan terintegrasi ke dalam semakin banyak pilihan layanan dan produk.

Albert Fox Cahn: Kami melihat lebih banyak uang yang dihabiskan untuk alat yang lebih invasif yang menangkap data dari desain kehidupan kami yang pernah kami anggap sakral. Saya yakin bahwa ada reaksi politik yang meningkat secara faktual dengan keuntungan vitalitas teknologi, kapitalisme pengawasan ini, keuntungan dari, Anda tahu, konsolidasi perusahaan.

Jennifer: Dan dia berpikir bahwa tekanan akan mengarah pada peraturan privasi data baru di AS. Sebagian karena bidang ini menjadi lebih buruk.

Albert Fox Cahn: Dan setelah kami mempertimbangkan keuntungan dari pelabelan data yang terjadi pada jenis, Anda tahu, pasukan manusia yang ingin menuangkan rekaman ini untuk mengubahnya menjadi jenis bahan lapangan yang sekarang kami pegang untuk melatih pembelajaran mesin sistem. Kemudian ada sekumpulan orang tua yang pasti dapat mengambil data itu, membuat epik, mengambil tangkapan layar, dan mengubahnya menjadi sesuatu yang dipublikasikan. Dan, jadi, Anda tahu, saya, saya benar-benar tidak pernah lagi mempertimbangkan perusahaan setelah mereka menyatakan bahwa mereka memiliki cara ajaib untuk mengamankan semua data yang kami serahkan kepada mereka, ada kemampuan terus-menerus yang merugikan setelah kami, serius setelah kita berurusan dengan produk apa pun yang dalam pelatihan awal dan fragmen jenisnya.

[CREDITS]

Jennifer: Episode ini pernah dilaporkan oleh Eileen Guo, diproduksi oleh Emma Cillekens dan Anthony Green, diedit oleh Amanda Silverman dan Mat Honan. Dan itu digabungkan oleh Garret Lang, dengan lagu otentik dari Garret Lang dan Jacob Gorski.

Terima kasih telah mendengarkan, saya Jennifer Solid.

Cakupan Asli

Baca juga

Abaikan bayi desainer.  Inilah cara CRISPR mengubah sebagian besar kehidupan

Abaikan bayi desainer. Inilah cara CRISPR mengubah sebagian besar kehidupan

Abaikan He Jiankui, ilmuwan bahasa China yang menciptakan bayi yang diedit gennya. Sebagai tambahan, meskipun …

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *