Fungsi AI di Kantor Baru Saja Dimulai

(Business Lounge Journal – Human Capital)

Dalam beberapa tahun mendatang, “agen” AI yang otonom dapat melakukan segala macam tugas untuk kita, dan dapat menggantikan seluruh fungsi pekerjaan kerah putih, seperti menghasilkan prospek penjualan atau menulis kode (coding). Tidak seperti chatbot biasa yang kita gunakan saat ini, entitas ini dapat menjelajah dunia digital dan melakukan berbagai hal untuk kepentingan kita. Mereka dapat masuk ke akun, berkomunikasi atas nama kita melalui teks dan suara, menulis program, dan secara teori melakukan hampir semua hal lain yang kita lakukan dengan komputer kita. Implikasi dari penerapan teknologi ini pada dunia mungkin kecil pada awalnya, namun pada akhirnya mereka akan menyadari manfaat penuh—dan bahaya—yang ditimbulkan oleh AI.

Aaron Levie, kepala eksekutif Box, perusahaan file-sharing dan manajemen konten berbasis cloud, baru-baru ini mengatakan bahwa cara AI mengambil alih tugas-tugas yang hingga saat ini hanya dapat dilakukan oleh manusia “mungkin merupakan hal terbesar yang pernah terjadi. ” kepada perusahaannya. Dustin Moskovitz, salah satu pendiri Facebook dan sekarang menjadi CEO Asana, sebuah sistem manajemen kerja berbasis cloud untuk tim, mengatakan bahwa agen AI yang sepenuhnya otonom, masih berada pada tahap awal, dan sering kali gagal dalam menjalankan tugas.

Meski begitu, perusahaannya berfokus untuk memungkinkan semua orang—bukan hanya pemrogram—untuk menciptakan apa yang suatu hari nanti bisa dianggap sebagai cikal bakal agen tersebut, dengan membiarkan orang membangun alur kerja yang memerlukan AI untuk melakukan tugas tertentu. Sales-development representatives biasanya merupakan jabatan awal dalam seluruh pekerjaan penjualan. Mereka ditugaskan untuk menemukan, meneliti, dan melakukan penjangkauan awal—melalui email, LinkedIn, dan sejenisnya—kepada calon pembeli. Mereka merupakan kandidat awal digantikan AI.

Asana telah menciptakan rutinitas yang sebagian besar mengotomatiskan peran rekanan pengembangan penjualan, namun menyerahkan kepada manusia untuk meninjau dan menyetujui pesan penjangkauan apa pun sebelum dikirim. Agen AI otonom 11x yang berbasis di London, bernama Alice, mengambil langkah lebih jauh, kata CEO Hasan Sukkar. Alice bekerja 24 jam sehari tanpa pengawasan manusia untuk meneliti calon klien dan menjangkau mereka semua sendiri. Saat ini, ia menyusun dan mengirimkan email dan pesan lain yang dibuatnya. Mulai bulan depan, 11x akan mulai menguji sistem yang lebih jauh lagi, dan benar-benar melakukan panggilan telepon suara pertama dengan calon pelanggan. Ini akan melibatkan mereka dalam percakapan untuk mengumpulkan informasi yang dibutuhkan—selama manusia memilih untuk ikut serta dan setuju untuk menerima panggilan dari bot.

Alice menggunakan beberapa platform AI yang berbeda untuk mencerna, menghasilkan, dan memeriksa fakta konten. Ini termasuk Kebingungan dalam mencari informasi tentang target penjualan potensial, dan merangkumnya; ChatGPT untuk mencerna data tersebut; dan Claude karena membuat email dan jenis pesan lain untuk dikirimkan kepada mereka. Seiring dengan semakin berkembangnya platform ini dari waktu ke waktu, Alice juga seharusnya mengalami hal yang sama.

Dalam prosesnya, Alice menggunakan AI untuk memeriksa pekerjaannya sendiri—misalnya, menggunakan ChatGPT untuk mengevaluasi apakah salah satu AI lain dalam pipeline ini kemungkinan memiliki informasi halusinasi yang salah. Menggunakan AI untuk memeriksa kerja AI lain juga merupakan ide di balik startup Maihem yang didirikan oleh dua orang, yang diluncurkan pada tahun 2023. Semua ini terjadi tanpa pengawasan manusia sama sekali. Manusia dapat memeriksa pekerjaan Alice jika mereka mau, dan ketika perusahaan pertama kali mulai menggunakan Alice, sering kali karyawan mereka melakukannya, kata Sukkar

Devin, dari Cognition Labs yang berbasis di San Francisco, menggemparkan dunia AI pada bulan Maret, ketika video demo dirilis yang menunjukkan kemampuannya untuk menyelesaikan sendiri seluruh tugas pengkodean yang rumit. Belakangan, beberapa pemrogram mempermasalahkan demo tersebut, dengan menyatakan bahwa demo tersebut telah diedit dengan cara yang menipu. Salah satu pembuat kode, seorang pakar visi komputer, mengatakan bahwa Devin telah salah memahami apa yang dia minta ketika dia mengirimkan tugas ke dewan Upwork.

Kontroversi yang diilhami oleh demo perusahaannya, dijawab oleh CEO Cognition Labs Scott Wu yang mengatakan bahwa ini “sangat dini” untuk Devin, dan bahwa mereka akan “sering membuat kesalahan.” Pemrogram lain telah mendokumentasikan bagaimana mereka berhasil menggunakan Devin untuk membangun keseluruhan aplikasi dari awal hingga selesai, tambahnya. Baru-baru ini, pakar AI Ethan Mollick di Wharton, menunjukkan eksperimen suksesnya dengan Devin, yang berhasil, dengan sedikit dorongan, membuat akun di Reddit dan mulai menuntut pembayaran untuk menyelesaikan tugas pengkodean.

Devin bekerja dengan mengizinkan agen AI intinya memutuskan cara terbaik menggunakan sejumlah alat, termasuk model bahasa besar. Itu dapat menggunakan web untuk melakukan penelitian, menggunakan aplikasi, atau membangun situs web. Devin juga dapat menulis dan menjalankan kode. Dan ia memiliki kemampuan untuk memberi tahu pengawas manusianya ketika ia menemui masalah yang tidak dapat diselesaikannya—seperti Captcha yang dirancang untuk mencegah bot seperti itu masuk ke layanan tertentu. Salah satu validasi dari pendekatan di balik Devin adalah bahwa sudah ada beberapa alternatif sumber terbuka, terutama OpenDevin dan GPT Pilot, yang dapat membangun semuanya sendiri, mulai dari aplikasi hingga layanan web. Namun, satu tes terhadap kemampuan mereka menunjukkan bahwa mereka hanya berhasil satu kali dalam lima kali.

Untuk saat ini, ketika agen AI diminta untuk menangani sesuatu yang baru, yang terbaik adalah jika manusia memantau apa yang dilakukannya, dan mengarahkannya ketika gagal atau tersesat—sebuah konsep yang dikenal sebagai “human in the loop.” Artinya, para agen ini kurang otonom, dan lebih bersifat proaktif, namun belum sepenuhnya independen. Meskipun ia optimis dengan potensinya, Levie dari Box mengatakan bahwa untuk saat ini AI hanya sebatas melakukan tugas-tugas individual dan terpisah. Perusahaan telah menyimpan sejumlah besar informasi di sistem Box, sehingga AI digunakan terutama sebagai cara untuk membuat semua data tersebut berguna. Misalnya, AI dapat digunakan untuk menandai klausul dalam kontrak yang mungkin berisiko, atau mentranskripsikan semua video yang disimpan perusahaan, dan kemudian memungkinkan orang mengajukan pertanyaan tentang kumpulan teks tersebut.

Bagi perusahaan yang menawarkan produk lengkap untuk tugas yang sudah dipahami dengan baik, seperti 11x, keterlibatan manusia sudah dimasukkan ke dalam logika sistem, kata CEO Sukkar. Mendefinisikan urutan tugas yang diberikan kepada Alice untuk diselesaikan—dengan kata lain logika bisnis, atau algoritmenya—sangat penting, dan memerlukan banyak eksperimen, tambahnya. Artinya, di masa mendatang, banyak dari kita tidak akan digantikan oleh karyawan virtual, melainkan kita akan menggunakan mereka untuk melakukan sebagian pekerjaan kita. Dalam prosesnya, mungkin juga melatih mereka untuk berbuat lebih banyak lagi.

Pada akhirnya, beberapa karyawan virtual mungkin tidak membutuhkan kita sama sekali, dan orang-orang yang menggunakan sistem ini pada dasarnya akan menjadi supervisor mereka. Wu, dari Cognition Labs, mengatakan salah satu tujuannya adalah menyediakan tim asisten pengkodean berbasis AI bagi siapa saja yang membutuhkannya. Sukkar dari 11x memiliki tujuan serupa, hanya karyawan virtual yang ditawarkan perusahaannya yang akan bekerja di bidang penjualan.

Jika agen AI berhasil membuat manusia lebih produktif, hal ini akan menyebabkan hilangnya beberapa pekerjaan. Yang masih belum jelas adalah seberapa cepat hal ini akan terjadi.