汚い仕事をするAIエージェント?クロード モデルはオフィスワークの様相を変えることができます

Auto Draft

人工知能の発展を見ていると、いつか私たちの生活を一変させるテクノロジーであるという印象を持つ人もいるかもしれません。多くの人は、これを自分の仕事に対する本当の脅威として認識しており、時間の経過とともに単に自動化される可能性があります。もちろん、これは完全に無意味な考えではありません。

少し前に、NVIDIA の現 CEO ジェンスン フアン氏は次のように認めました。 その目標は、このような AI ベースのアシスタントを最大 1 億人に導入することです。これにより、人々は日常的で不毛な作業に集中することがなくなり、仕事の効率が向上します。興味深い話ですが、そのような野心を持っているのは彼だけではありません。

Anthropic も最近、非常に似たアイデアを思いつき、同様に興味深いものを提示しました。今回は、私たちのコンピュータの一部となって、私たちのためにすべての「汚れ仕事」を行ってくれるアシスタントについて話します。これは具体的にどのように機能するのでしょうか?

コンピューターを制御するツールとしての Anthropic のクロード モデル

新しいバージョンの Claude は、他の多くのモデルでは長い間実現できなかったことを実現できます。

数日前、Anthropic は本当に特別なことを達成したと公式に発表しました。紹介したように、Claude と呼ばれる AI モデルの最新バージョンは、コンピューター上で多くのタスクを実行するように適応されています。一見すると特別なことではありませんが、多くの可能性を秘めています。

具体的には、ブラウザを開いたり、インターネット上で検索したり、マウスやキーボードを使用してデータを入力したりすることについて話しています。実際、これらは非常に基本的なものですが、現段階ではこのモデルの有用性を大幅に高めるには十分です。

特別に用意されたデモンストレーション中 ワイアード編集部員, クロードの新たな能力が披露されました。たとえば、モデルはサンフランシスコのゴールデン ゲート ブリッジで夕日を見る旅行を計画するように依頼されました。

Człowiek i asystent AI人間の日常的な事務作業を手助けするロボット?私たちの手の届くかもしれない未来のビジョン。

効果?クロードさんは Chrome を使って適切な情報 (夕日を見るのに最適な場所も) を見つけ、カレンダー アプリを開いてイベントをスケジュールし、旅行に招待された人と共有しました。

2 番目の課題は、このモデルを宣伝する場所となる簡単な Web サイトを構築することでした。このモデルは、Microsoft の Visual Studio Code を使用してこのタスクにも対応しました。しかし、ある欠点は、Web サイトが当初 1990 年代には様式化されすぎていたことであることが判明しました。

興味深いことに、モデルは、表示されたエラーを修正するように要求されると、コード エディターに戻り、適切なバグを見つけて削除しました。このようにして、人間によるプログラミングの介入をほとんど行わずに、AI が自ら Web サイトを作成しました。

クロードはオフィスオートメーションの大きな希望ですか?

https://twitter.com/hellokillian/status/1849248458701705334

Anthropic 社の最高科学責任者でジョンズ・ホプキンス大学准教授のジャレッド・カプラン氏は、これが私たちが AI 開発の新たな段階に入る方法だと述べた。そのイノベーションのおかげで、モデルは人間が利用できるすべてのデジタル ツールを使用できるため、作業が大幅に容易になります。

別の同社代表者、マイク・クリーガー氏は、AIベースのエージェントが時間の経過とともに特定の日常業務を自動化することを会社全体が期待していると明らかにした。もちろん、これは人々の生産性の向上につながり、より要求の高いことに集中できるようになります。興味を持った本人は、もしAIモデルが彼のために「汚れ仕事」をしてくれたら、ギターを弾きに行くだろうと告白した。

同社が提供した情報によると、他の数社が自動化の研究を目的として問題のモデルをすでにテストしているという。ここで特に言及されているのは、Canva (デザインおよび編集支援) と Replit (コーディング タスク) の使用法です。

クロードを最初に使用したエンティティのグループはさらに大きく、おそらく時間の経過とともに増加するでしょう。しかし、これは、このようなテクノロジーは効率と有効性を向上させる手段として扱うことができるため、企業の間でこのようなテクノロジーに大きな関心が寄せられていることを示しています。

幸せになるまでの道のりはまだまだ遠い

このアイデアは野心的ですが、実行にはまだ改良が必要です。すべてにもかかわらず、クロードは非常に興味深いツールであるようです。

クロードの能力はすでに優れていますが、彼を本格的な AI アシスタントとして完全に実装して使用するには、まだ長い道のりがあります。結局のところ、私たちは企業に多大な損失を生じさせないために信頼できるものについて話しているのです。これは現時点では不可能であることが判明しました。

Anthropic は、自社のモデルが現在 ChatGPT 4 や Gemini などのモデルよりも優れていると主張していますが、依然として「非常に不完全」です。 OSWorld でのテストでは、Claude は実際に競合他社よりも優れたパフォーマンスを示しています (正しく完了したタスクの 14.9% に対し、ChatGPT4 では 7.7% を達成) が、人間の精度にはまだ程遠いです。

ただし、開発の可能性は大きく、今後の開発の方向性は、そのようなツールに興味を持つ企業によって左右されることになります。いつかこのような AI コンピュータ アシスタントが多くの一般的な事務職の標準となる可能性が非常に高いです。しかし今のところ、これに至るまでの道のりは長く、非常に険しいようです。