BrowserOS — це браузер з відкритим кодом, що працює на основі агентів, який автоматизує роботу в Інтернеті з метою конкуренції з Comet та Atlas.

  • BrowserOS запускає локальні агенти штучного інтелекту на форку Chromium, з конфіденційністю за замовчуванням та підтримкою розширень.
  • Поєднуйте автоматизацію браузера з MCP-серверами та будь-яким LLM (OpenAI, Anthropic або локальними опціями, такими як Ollama/LM Studio).
  • У ньому пропонується бачення, в якому браузер є «офісом» агентів багаторазового використання для реальних завдань у корпоративних веб-додатках.
  • 100% проєкт із відкритим вихідним кодом (AGPL-3.0), активна спільнота та чіткий фокус: практичний ШІ у браузері, а не в хмарі.

БраузерОС

Якщо ви чули про BrowserOS і задавалися питанням, чому так багато людей говорять про «браузер з розумом», ось повна картина. BrowserOS — це браузер з відкритим кодом, який містить агенти штучного інтелекту, здатні розуміти та виконувати інструкції природною мовою.Клацання, введення тексту та перегляд веб-сторінок від вашого імені, використовуючи ваші сеанси авторизації та локальний доступ. Все це з підходом конфіденційності за замовчуванням та без використання хмарної інфраструктури для ваших особистих даних.

Ця пропозиція — не просто чергова випадкова ідея у світі браузерів: BrowserOS народився як форк Chromium, з сумісністю з розширеннями Chrome та чіткою метою.: бути відкритою та орієнтованою на конфіденційність альтернативою таким рішенням, як Атлас (ChatGPT)Comet (Perplexity) або Dia, на додаток до традиційних браузерів. Ідея проста для пояснення та потужна за своїм впливом: ви описуєте завдання, а агент виконує його з вашого комп’ютера, використовуючи ваші облікові дані та без надсилання вашої історії третім особам.

Що таке BrowserOS і чим він відрізняється?

По суті, BrowserOS — це браузер, який запускає агенти штучного інтелекту безпосередньо.Це дозволяє вам писати інструкції так, ніби ви пояснюєте їх колезі, а система сама бере на себе виконання послідовності дій: відкриття сторінок, початок пошуку, заповнення форм або вилучення даних. Це не зовнішній помічник, який «дивиться» на ваш браузер: агенти працюють у самому BrowserOS.

Оскільки він побудований на Chromium, досвід здається знайомим з першої хвилиниЗвичний інтерфейс, сумісність із розширеннями, імпорт даних Chrome та практично миттєве впровадження для тих, хто вже знайомий з екосистемою. Цей ефект «відчуття дому» зменшує труднощі під час початку автоматизації, не жертвуючи щоденним використанням.

Чому саме зараз: час для агентів у браузері

За останні місяці інструменти програмування на основі штучного інтелекту багаторазово підвищили продуктивність розробників. Однак мільйони працівників інтелектуальної праці все ще застрягають у повторюваних завданнях браузера.Копіювання та вставка, заповнення форм, експорт даних панелі інструментів, запуск кампаній тощо. Це щоденне вузьке місце.

Команда BrowserOS припускає, що вперше з часів Netscape, У нас є можливість переосмислити браузер для реальної роботиЯкщо ШІ вже «пише» цілі проекти, чому він також не може натискати кнопки, переміщатися по веб-інтерфейсу або об’єднувати дії, як це робили б ви, але без необхідності постійно контролювати процес?

Проблеми, які вирішує BrowserOS

До появи BrowserOS розгортання агентів у реальних завданнях не вдавалося з дуже специфічних причин. У проєкті визначено три основні перешкоди, які заважали його масовому впровадженню.особливо в компаніях:

  • Доступ до автентифікованих сесійБагато агентських рішень працюють на віддалених комп'ютерах і не можуть працювати з вашими реальними обліковими записами (Gmail, LinkedIn, корпоративні інструменти). Як наслідок, вони не справляються з реальними завданнями.
  • Фрагментація інструментуДеякі агенти взаємодіють із MCP-серверами, інші виконують лише веб-автоматизацію, а ще інші об'єднують API разом, як-от Zaps. Бракує єдиного «інструментарію» для побудови складних потоків.
  • Чорна скринька та замокКілька популярних браузерів є пошуковими або рекламними продуктами. Вони не відкривають свої запити чи внутрішні механізмиВони призначають вам певний LLM та маршрутизують дані на свої сервери. Для багатьох компаній це однозначне «ні».

BrowserOS реагує з нуля: агенти у вашому браузері, що працюють на вашому комп'ютеріПоєднання MCP та автоматизації, а також 100% відкритої філософії, що дозволяє проводити аудит та форкувати будь-коли, вирішує проблему, яка досі робила делегування серйозної роботи штучному інтелекту в браузері неможливим.

Як працює BrowserOS та перші кроки

Потік прямий: Ви завантажуєте та встановлюєте BrowserOS так само, як і будь-який інший браузер.Ви входите на сайти, якими користуєтеся щодня, і звідти описуєте завдання природною мовою. Агент діє у вашому реальному контексті, з вашими дозволами та активними сеансами, ніби ви перебуваєте перед екраном.

  1. Завантаження та встановлення BrowserOS для вашої системи (доступно для macOS, Windows та Linux). Якщо вас турбує встановлення в Linux, він доступний як AppImage. на GitHub.
  2. Імпортуйте свої дані Chrome якщо ви зацікавлені у збереженні закладок, історії чи налаштувань.
  3. Підключіть свого постачальника послуг штучного інтелекту: OpenAIАнтропні або локальні моделі через Ollama/LM Studio, з вашими власними ключами.
  4. Почніть автоматизаціюСформулюйте цілі в тексті та дозвольте агенту виконати кроки в Інтернеті.

Ви також можете поєднання автоматизації браузера з MCP-серверами та виклики API в одному потоці. Ця комбінація дозволяє створювати помічників, здатних збирати дані, обробляти їх у моделі та оновлювати електронні таблиці або SaaS-інструменти, все це об'єднано в ланцюг одним агентом.

Ключові особливості BrowserOS, які мають значення

  • Побудова агентів природною мовоюКажіть, що хочете, без програмування.
  • Свобода моделейВізьміть свої ключі та перемикайтеся між LLM або запускайте локальні моделі.
  • Це "звичайний" браузерХромована основа, Чи працюють ваші розширення Chrome?.

Конфіденційність – це основа дизайну: Ваші дані, історія та сеанси залишаються на вашому комп’ютері.Без інвазивної телеметрії чи залежності від зовнішніх хмар. За бажанням, ви можете працювати виключно з локальними моделями та повністю перекрити кран.

І якщо цього було недостатньо, Вони працюють над блокувальником реклами на базі штучного інтелекту що обіцяє охопити складніші сценарії, ніж статичні фільтри. А для розробників та досвідчених користувачів передбачена підтримка використання браузера як MCP-сервера, інтегруючи його з такими інструментами, як claude-code o gemini-cli.

Інтеграції, MCP та використання зовнішніх інструментів

Одним з його найсильніших переваг є те, що BrowserOS може працювати як MCP-серверЦе означає, що інші програми, сумісні з протоколом (такі як згадані) claude-code o gemini-cliВони можуть «спілкуватися» з вашим браузером і делегувати завдання веб-інтерфейсу своїм агентам.

Цікава оркестровка: Вам не потрібно вибирати між автоматизацією браузера чи викликом API.Ви можете робити обидва в одному рецепті агента. Наприклад, витягувати дані з порталу зі складним інтерфейсом користувача, обробити їх за допомогою моделі, а потім завантажити результат у електронну таблицю або CRM, без використання різних інструментів вручну.

Швидке порівняння з Chrome, Brave, Arc/Dia та Perplexity Comet

Порівняно з Chrome

Завдяки відкритому вихідному коду Chromium, BrowserOS успадковує фундамент, але Chrome роками не мав суттєвих удосконалень штучного інтелекту для автоматизації.Без MCP, без локальних агентів, без цього інтегрованого рівня оркестрації, він залишається просто чудовим браузером... без "помічника, що клацає для вас".

Зіткнувшись із хоробрим

Хоробрий проклав шлях у приватне життя, але Їхня увага зосереджена між криптовалютою, пошуком, VPN та іншим.BrowserOS робить свою справу: штучний інтелект у браузері та реальна автоматизація роботи.

Дуга/діаметр облицювання

Багато людей оцінили пропозицію Арка, але Він закрив свій код і залишив користувачів у підвішеному стані.У BrowserOS все навпаки: 100% відкритість, можливість аудиту, можливість розширення, залучення спільноти та без залежності від одного постачальника.

Зіткнувшись із кометою розгубленості

Perplexity — це, зрештою, компанія з пошуку та реклами. Ваша історія може стати продуктомУ BrowserOS обіцянка чітка: локальні дані та повний контроль з вашого боку.

Безпека, конфіденційність та ліцензування

Філософія — «конфіденційність понад усе»: Ви використовуєте власні ключі API або локальні моделі з Ollama/LM StudioВи вирішуєте, що залишається на вашому пристрої, а що ні, і зберігаєте історію та сеанси поза досяжністю третіх осіб.

На правовому та громадському рівнях, BrowserOS — це безкоштовне програмне забезпечення, ліцензоване за AGPL-3.0.Ви можете побачити, як це створено, переглянути системні підказки, запропонувати зміни, створити форк проєкту та зробити свій внесок. Все це в духі «зроблено з любов’ю із Сан-Франциско», про який згадували його творці.

Спільнота, цифри та імпульс проекту

Інтерес відчутний. Він може похвалитися понад 4,3 тисячами зірок на GitHub, понад 25 000 завантажень та спільнотою Discord, що налічує понад тисячу учасників. людей, які активно беруть участь. В іншому фрагменті з'являються такі показники, як «6,3 тис.» та «558» (пов'язані з репозиторієм, ймовірно, зірки/підписники/гілки), що свідчить про тенденцію до зростання.

Технічно, проєкт вирізняється своєю основою C++ на базі гіганта Chromium, вимогливий шлях, що вимагає багато наполегливої ​​праці та підтримки сумісності зі змінами вище, одночасно продовжуючи впроваджувати інновації на рівні агента.

Варіанти використання та демонстрації

Подумайте про завдання з реального світу: Визначте профілі, які вас цікавлять, серед ваших заявок на LinkedIn та додайте їх до Google ТаблиціЗаповнюйте довгі форми, збирайте дані з кількох вебсайтів або готуйте попередній брифінг з ключовою інформацією для зустрічі. Ви описуєте це в тексті, а агент орієнтується та діє так само, як і ви.

Є аудіовізуальний матеріал, який демонструє концепцію в дії: демо-версії, такі як «HackerNews.top.3.mp4», «use-browserOS-to-chat.mp4» або «use-browserOS-to-extract.mp4» Вони навчають усьому: від асистованих розмов до вилучення даних у реальних умовах, підкреслюючи, що автоматизація відбувається у вашому автентичному контексті.

Бачення: Браузер як «операційна система» для агентів

Компанії живуть у браузері: Salesforce, SAP, Workday, внутрішні інструменти… Армія працівників інтелектуальної праці проводить 60–80% свого дня у веб-додаткахЯкщо агент може клацати та друкувати як людина, він може автоматизувати практично будь-який інтерфейс, включаючи ті, що не мають API.

Бачення, представлене проектом, полягає в тому, що ІТ-відділи можуть розгортати багаторазові «агенти-співробітники»«Агент витрат» компанії, спільний для спільноти «рекламний агент Facebook», якого ви адаптуєте до свого робочого процесу тощо. Менше механічних завдань, більше зосередження на тому, що додає цінності.

Хто стоїть за BrowserOS

Ядро проєкту очолюють два брати-близнюки, які мають серйозний досвід роботи у великих технологічних компаніях. Ніхіл працював над бекендом Reels та стрічкою Facebook, використовуючи C++ та інші системи.Нітін був інженером машинного навчання в YouTube, беручи участь у першій великій моделі рекомендацій (LRM) платформи. Це поєднання низький рівень а шар штучного інтелекту дає їм свободу працювати з Chromium та водночас створювати поверх нього «мозок агента».

  • Досвід роботи з C++ та великомасштабними системами: обслуговування критично важливих та високопродуктивних послуг.
  • Спеціалізація з машинного навчання та рекомендаторівглибоке розуміння сучасних моделей та їх впровадження.

Голоси громади та менш відомі альтернативи

Серед досвідчених користувачів існує попит на «різні» браузери з потенціалом. Були протестовані такі альтернативи, як Wavebox, Ulaa, Arc, Ghost Browser або Thorium.Браузер Zen хвалять за його продуктивність (хоча він не базується на Chromium). У цих тестах зазначається, що Wavebox дуже комплексний, але може бути приголомшливим, а розкриття його повного потенціалу займає багато часу; Ulaa вихваляється конфіденційністю, але містить забагато додаткових функцій; Arc викликав неоднозначну реакцію; а Ghost Browser не зовсім підкорив усіх.

Щодо торію, то чули, що Це дуже швидко, але з деякими проблемами безпеки.Ось чому деякі люди відкладають це. І часто рекомендація не полягає в тому, щоб купувати найвідоміші, оскільки вони вже перепробували близько двадцяти, а мета — відкрити рідкісні екземпляри, які пропонують щось справді нове.

Короткий посібник з використання агентів

Опинившись усередині, «чарівний момент» настає, коли ви описуєте реальні завдання. Замість того, щоб запитувати «пошук такого-то» та повертати зведення, агент виконує взаємодію у вашому браузері.Якщо вебсайт не має API, це не має значення: є інтерфейс користувача, є дії, які агент може точно відтворити.

  1. Опишіть свою метуНаприклад, пошук певних контактів у професійній мережі та перенесення їхньої інформації в електронну таблицю.
  2. Підтвердьте кроки якщо агент запропонує їх вам (корисно для аудиту того, що він робитиме).
  3. Контролюйте вперше Щоб налаштувати підказки або правила, використовуйте рецепт повторно.

Використання MCP та можливість «поєднувати» автоматизацію, API та моделі дозволяють це один агент вирішує всі наскрізні процеси, що раніше вимагало склеювання кількох інструментів клейкою стрічкою.

Конфіденційність за проектом та контроль моделі

Ключовою перевагою є свобода вибору рушія штучного інтелекту. Ви можете працювати з OpenAI, Anthropic або зберігати все локально за допомогою Ollama/LM Studio.Маршрут коригується залежно від вартості, затримки або чутливості проекту. Ті, хто надає пріоритет абсолютній конфіденційності, мають 100% локальний маршрут.

Крім того, Проєкт публікує та дозволяє редагувати системні підказкиЦе рідкість. Така прозорість полегшує адаптацію поведінки агента до вашої організації або конкретної справи та аудит того, як він приймає рішення.

Кроки для участі в проекті BrowserOS

Якщо ви вірите в ідею та хочете допомогти, є кілька способів підтримати її. Залиште зірку на GitHub Це допомагає підвищити видимість; завантаження та використання забезпечує цікаву телеметрію (якщо ви її активуєте) та зворотний зв'язок; а приєднання до Discord дозволяє вам пропонувати, відкривати та тестувати нові функції.

Зрештою, на офіційному вебсайті зазвичай відображається нагадування про завантажте браузер для вашої системиВи можете імпортувати дані Chrome, якщо бажаєте, та підключити бажаного постачальника штучного інтелекту. Далі вам залишиться лише створити агентів та поділитися тим, що вам підходить.

Дивлячись на картину в цілому, BrowserOS утверджується як Браузер з відкритим кодом, орієнтований на агентів, з пріоритетом конфіденційності, заснований на Chromium та зі зростаючою спільнотою.Він поєднує сумісність з розширеннями, MCP, підтримку локальних моделей (Ollama/LM Studio) та відкрите зобов'язання, яке включає ліцензію AGPL-3.0 та редагування підказок. На відміну від Chrome, Brave, Arc/Dia чи інших пропозицій, орієнтованих на рекламу та пошук, він прагне принести «магію» штучного інтелекту безпосередньо на сайт, де ви працюєте щодня. І хоча ще є деталі, які потрібно доопрацювати (наприклад, блокувальник реклами на базі штучного інтелекту, який з'явиться найближчим часом, або епізодичні проблеми з встановленням у Windows), темпи та залученість користувачів вказують на проєкт, який розвивається, з любов'ю створений у Сан-Франциско та з бажанням перетворити Інтернет з простого ланцюжка кліків на, нарешті, платформу для агентів, які працюють разом з вами.