Skip to content

Điểm Hẹn Công Nghệ

Điểm Hẹn Công Nghệ

  • Home » 
  • Máy Tính » 
  • Browser Use: Giải Pháp AI Tự Động Hóa Trình Duyệt Mã Nguồn Mở Đáng Tin Cậy Thay Thế ChatGPT Operator

Browser Use: Giải Pháp AI Tự Động Hóa Trình Duyệt Mã Nguồn Mở Đáng Tin Cậy Thay Thế ChatGPT Operator

By Administrator Tháng 8 4, 2025 0
Robot AI agent đang làm việc tại trung tâm cuộc gọi, minh họa tự động hóa tác vụ trình duyệt
Table of Contents

Trong bối cảnh công nghệ AI ngày càng phát triển, khả năng các tác nhân AI (AI agents) tự động điều khiển trình duyệt web và thực hiện các nhiệm vụ như con người không còn là điều xa vời. Những công cụ như ChatGPT Operator mang đến sức mạnh đáng kinh ngạc, nhưng đi kèm với một mức giá không hề nhỏ. Thay vì bỏ ra một khoản chi phí lớn, chúng tôi đã tìm kiếm một giải pháp thay thế miễn phí hoặc tiết kiệm hơn và bất ngờ phát hiện ra một lựa chọn hoạt động hiệu quả đáng kinh ngạc. Bài viết này sẽ đi sâu vào Browser Use, một công cụ AI agent mã nguồn mở hứa hẹn thay đổi cách chúng ta tương tác với web.

Browser Use: Đối Thủ Nguồn Mở Mạnh Mẽ Của ChatGPT Operator

ChatGPT Operator nổi tiếng với khả năng kiểm soát trình duyệt web, thực hiện các hành động như nhấp chuột và cuộn trang một cách tự động. Người dùng chỉ cần ra lệnh cho ChatGPT về nhiệm vụ cần thực hiện, chẳng hạn như đặt vé hoặc soạn thảo văn bản trong Google Docs, và công cụ sẽ tự động hoàn thành. Tuy nhiên, để sử dụng ChatGPT Operator, người dùng phải trả một mức phí khá cao, khoảng 200 USD mỗi tháng cho gói Pro của ChatGPT. Mức phí này có thể là rào cản lớn đối với nhiều cá nhân và doanh nghiệp nhỏ.

Trong quá trình tìm kiếm một giải pháp tự động hóa trình duyệt AI thay thế, chúng tôi đã khám phá ra Browser Use. Đây là một AI agent mã nguồn mở, có chức năng tương tự như ChatGPT Operator. Browser Use cho phép tương tác với trình duyệt web, điều hướng qua các trang web và thực hiện nhiều hành động khác nhau một cách tự động. Điều đáng chú ý là chi phí sử dụng Browser Use chỉ là một phần nhỏ so với đề xuất của ChatGPT.

Browser Use cung cấp hai tùy chọn linh hoạt cho người dùng. Tùy chọn đầu tiên là đăng ký dịch vụ đám mây với mức phí 30 USD mỗi tháng, cho phép chạy AI agent trên máy chủ của họ. Lựa chọn thứ hai, và cũng là phương án tiết kiệm nhất, là tự cài đặt Browser Use cục bộ trên máy tính cá nhân. Với phương án này, người dùng chỉ phải chịu phí sử dụng API của các mô hình ngôn ngữ lớn (LLM), mang lại sự linh hoạt và tối ưu chi phí tối đa. Mặc dù việc thiết lập Browser Use có thể không đơn giản như ChatGPT Operator, nhưng với một vài dòng lệnh cơ bản, nó hoàn toàn có thể được đưa vào hoạt động.

Robot AI agent đang làm việc tại trung tâm cuộc gọi, minh họa tự động hóa tác vụ trình duyệtRobot AI agent đang làm việc tại trung tâm cuộc gọi, minh họa tự động hóa tác vụ trình duyệt

Hướng Dẫn Chi Tiết Cài Đặt Browser Use Trên Máy Tính Cá Nhân

Để bắt đầu với Browser Use, bạn sẽ cần chuẩn bị hai yếu tố chính: cài đặt Python 3.11 trên máy tính và quyền truy cập API từ OpenAI (hoặc một LLM được lưu trữ cục bộ nếu bạn muốn).

Chuẩn Bị Cần Thiết

Là một AI agent, Browser Use yêu cầu một mô hình ngôn ngữ lớn (LLM) để hoạt động. Bạn có thể lấy quyền truy cập API từ trang web của OpenAI hoặc bất kỳ API nào tương thích với Browser Use. Lợi ích của việc sử dụng API là bạn có thể linh hoạt lựa chọn giữa các mô hình khác nhau (như GPT-3.5 và GPT-4) và chỉ phải trả tiền cho những gì bạn sử dụng, thay vì một khoản phí đăng ký trả trước cố định.

Trong quá trình thử nghiệm, chúng tôi đã sử dụng mô hình ChatGPT 4o. Tổng chi phí cho bảy tác vụ Browser Use thực hiện là dưới 1 USD. Tuy nhiên, nếu bạn kết hợp nó với DeepSeek API, chi phí sẽ còn rẻ hơn nhiều lần.

Mặc dù có thể sử dụng một LLM cục bộ trên máy tính, việc chạy một LLM có hiệu năng tương đương ChatGPT 4o đòi hỏi sức mạnh tính toán đáng kể mà hầu hết người dùng thông thường không có. Chúng tôi đã thử nghiệm mô hình LLM DeepSeek 7B trên máy tính cá nhân và hiệu suất không được như mong đợi. Do đó, khuyến nghị tốt nhất hiện tại là sử dụng API.

Giao diện website Browser Use hiển thị các gói dịch vụ và tùy chọn chi phíGiao diện website Browser Use hiển thị các gói dịch vụ và tùy chọn chi phí

Các Bước Cài Đặt Cơ Bản

Sau khi đã có quyền truy cập API, bạn có thể tạo môi trường ảo trong VS Code bằng cách vào View > Command Palette và nhập “create environment”. Sau đó, mở một terminal mới và cài đặt Browser-use bằng pip:

pip install browser-use

Tiếp theo, tạo một tệp .env trong cùng thư mục và thêm khóa API của bạn vào đó:

OPENAI_API_KEY="Your API Here"

Cuối cùng, tạo một tệp Python mới với tên app.py và dán đoạn mã sau:

from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio
from dotenv import load_dotenv

load_dotenv()

async def main():
    agent = Agent(
        task="Go to Reddit, search for 'browser-use', click on the first post and return the first comment.",
        llm=ChatOpenAI(model="gpt-4o"),
    )
    result = await agent.run()
    print(result)

asyncio.run(main())

Bạn có thể thay thế đoạn prompt mặc định bằng tác vụ của riêng mình, ví dụ: “Tìm kiếm Albert Einstein và mở trang Wikipedia của ông ấy”. Cuối cùng, chạy tệp python app.py bằng terminal:

python app.py

Đánh Giá Thực Tế: Browser Use Hoạt Động Hiệu Quả Đến Đâu?

Để kiểm tra khả năng của Browser Use, chúng tôi đã bắt đầu với các tác vụ đơn giản. Đầu tiên là yêu cầu công cụ tìm kiếm “Albert Einstein” trên Google và mở trang Wikipedia của ông. Khi chạy script, AI agent đã mở một cửa sổ trình duyệt mới và thực hiện nhiệm vụ một cách hoàn hảo.

Tiếp theo, chúng tôi yêu cầu Browser Use tìm kiếm “laptop gaming” trên Amazon và mở kết quả đầu tiên. Một lần nữa, AI agent đã hoàn thành tác vụ thành công.

Tại thời điểm này, chúng tôi đã khá tin tưởng vào khả năng điều hướng web thông minh của Browser Use. Để đẩy xa hơn giới hạn của nó, chúng tôi hướng dẫn nó truy cập Yahoo News và tóm tắt năm bài báo hàng đầu. Điều bất ngờ là Browser Use có thể hoàn thành tác vụ này chỉ trong vài phút, với các bản tóm tắt ngắn gọn và đúng trọng tâm.

Tuy nhiên, mọi thứ trở nên phức tạp hơn đối với Browser Use khi chúng tôi yêu cầu nó tìm chuyến bay từ London đến Paris trên skyscanner.com. Ban đầu, trang web đã chặn quyền truy cập do phát hiện bot, vì vậy chúng tôi phải can thiệp để vượt qua cơ chế này. Dù vậy, Browser Use vẫn gặp khó khăn – nó đã nhấp vào nút tìm kiếm mà không nhập chính xác “London” và “Paris” vào các trường tương ứng.

Cần lưu ý rằng bạn có thể ghép nối Browser Use với trình duyệt chính của mình, nơi tất cả các tài khoản đã đăng nhập. Điều này cho phép AI agent nhập dữ liệu vào Google Sheet hoặc dán bản tóm tắt Yahoo News vào Google Doc. Tuy nhiên, chúng tôi gặp một số vấn đề khi thiết lập nó với trình duyệt đang hoạt động của mình, nên đã tạm gác lại.

Tổng thể, đây là một thử nghiệm thú vị. Việc quan sát một AI agent tự điều hướng web và thực hiện các tác vụ thật sự hấp dẫn. Mặc dù Browser Use chưa hoàn hảo và vẫn còn một chặng đường dài để trở thành một AI agent mạnh mẽ hoàn toàn có thể duyệt web độc lập, công nghệ này vẫn còn ở giai đoạn sơ khai và chúng ta hoàn toàn có thể kỳ vọng vào những cải tiến đáng kể trong tương lai.

Nếu bạn sẵn sàng tìm hiểu và không ngại những trục trặc nhỏ trong quá trình thiết lập, hãy thử ngay Browser Use trên máy tính của mình. Đừng ngần ngại để lại bình luận nếu bạn gặp khó khăn và cần sự hỗ trợ từ cộng đồng công nghệ của DiemHenCongNghe.com.

Share
facebookShare on FacebooktwitterShare on TwitterpinterestShare on Pinterest
linkedinShare on LinkedinvkShare on VkredditShare on ReddittumblrShare on TumblrviadeoShare on ViadeobufferShare on BufferpocketShare on PocketwhatsappShare on WhatsappviberShare on ViberemailShare on EmailskypeShare on SkypediggShare on DiggmyspaceShare on MyspacebloggerShare on Blogger YahooMailShare on Yahoo mailtelegramShare on TelegramMessengerShare on Facebook Messenger gmailShare on GmailamazonShare on AmazonSMSShare on SMS
Post navigation
Previous post

Bảo Vệ Tài Khoản Online: Sức Mạnh Từ Tài Khoản Email Dự Phòng (Backup Email)

Next post

Cảnh Báo Lừa Đảo PayPal Mới: Chiêu Trò Tinh Vi Đánh Cắp Tài Khoản Người Dùng

Administrator

Related Posts

Categories Máy Tính Browser Use: Giải Pháp AI Tự Động Hóa Trình Duyệt Mã Nguồn Mở Đáng Tin Cậy Thay Thế ChatGPT Operator

Cảnh Báo Lừa Đảo PayPal Mới: Chiêu Trò Tinh Vi Đánh Cắp Tài Khoản Người Dùng

Categories Máy Tính Browser Use: Giải Pháp AI Tự Động Hóa Trình Duyệt Mã Nguồn Mở Đáng Tin Cậy Thay Thế ChatGPT Operator

Bảo Vệ Tài Khoản Online: Sức Mạnh Từ Tài Khoản Email Dự Phòng (Backup Email)

Categories Máy Tính Browser Use: Giải Pháp AI Tự Động Hóa Trình Duyệt Mã Nguồn Mở Đáng Tin Cậy Thay Thế ChatGPT Operator

Turboscribe: Giải pháp Chuyển Đổi Giọng Nói AI Miễn Phí và Đáng Tin Cậy cho Mọi Nhu Cầu

Leave a Comment Hủy

Recent Posts

  • Công nghệ Pin Silicon-Carbon: Giải pháp đột phá cho kỷ nguyên Smartphone hiện đại
  • Ảnh Chụp Màn Hình Có Thể “Tố Giác” Bạn: 7 Loại Cần Xóa Ngay Để Bảo Vệ Dữ Liệu Cá Nhân
  • Khám Phá Toàn Diện 6 Chế Độ Ánh Sáng Chân Dung Trên iPhone: Bí Quyết Chụp Ảnh Đẳng Cấp Chuyên Nghiệp
  • iPhone SE 2025: 5 Cải Tiến Đột Phá Để Trở Thành “Vua” Tầm Trung
  • Cảnh Báo Lừa Đảo PayPal Mới: Chiêu Trò Tinh Vi Đánh Cắp Tài Khoản Người Dùng

Recent Comments

Không có bình luận nào để hiển thị.
Copyright © 2025 Điểm Hẹn Công Nghệ - Powered by Nevothemes.
Offcanvas
Offcanvas

  • Lost your password ?