hermes - 💡(How to fix) Fix [i18n] Thai Translation: Reference Part e - tools-reference, index [1 participants]

Official PRs (…)
ON THIS PAGE

Recommended Tools

×6

Utilities matched from this issue’s tags and category — try them while you read without losing context.

GitHub issue graph ai analysis

Paste a GitHub issue URL. We fetch that issue, discover linked issues from bodies/comments/timeline, collect linked pull requests, and produce a structured English report.

The report is written in English Markdown for sharing and archival.

Helpful · Quick feedback

Loading…
GitHub stats
NousResearch/hermes-agent#15150Fetched 2026-04-25 06:24:13
View on GitHub
Comments
0
Participants
1
Timeline
7
Reactions
0
Author
Participants
Timeline (top)
mentioned ×3labeled ×2subscribed ×2

Error Message

| browser_console | รับ output ของ console ของเบราว์เซอร์และข้อผิดพลาด JavaScript จากหน้าปัจจุบัน ส่งคืนข้อความ console.log/warn/error/info และข้อยกเว้น JS ที่ไม่ได้ถูกจับ ใช้สิ่งนี้เพื่อตรวจจับข้อผิดพลาด JavaScript แบบเงียบ, การเรียก API ล้มเหลว, และคำเตือนของแอปพลิเคชัน Requi… | — |

Fix Action

Fix / Workaround

ToolDescriptionRequires environment
patchการแก้ไขแบบ find-and-replace ที่เจาะจงในไฟล์ ใช้สิ่งนี้แทน sed/awk ใน terminal ใช้ fuzzy matching (9 กลยุทธ์) ดังนั้นความแตกต่างเล็กน้อยของ whitespace/indentation จะไม่ทำให้เกิดข้อผิดพลาด ส่งคืน unified diff จะรันการตรวจสอบไวยากรณ์โดยอัตโนมัติหลังการแก้ไข…
read_fileอ่านไฟล์ข้อความพร้อมหมายเลขบรรทัดและการแบ่งหน้า ใช้สิ่งนี้แทน cat/head/tail ใน terminal รูปแบบเอาต์พุต: 'LINE_NUM|CONTENT' แนะนำชื่อไฟล์ที่คล้ายกันหากไม่พบ ใช้ offset และ limit สำหรับไฟล์ขนาดใหญ่ หมายเหตุ: ไม่สามารถอ่านรูปภาพได้…
search_filesค้นหาเนื้อหาไฟล์หรือค้นหาไฟล์ตามชื่อ ใช้สิ่งนี้แทน grep/rg/find/ls ใน terminal ใช้ ripgrep-backed เร็วกว่าเทียบเท่าใน shell การค้นหาเนื้อหา (target='content'): ค้นหา Regex ภายในไฟล์ โหมดเอาต์พุต: การจับคู่ทั้งหมดพร้อมหมายเลขบรรทัด…
write_fileเขียนเนื้อหาลงในไฟล์ โดยแทนที่เนื้อหาเดิมทั้งหมด ใช้สิ่งนี้แทน echo/cat heredoc ใน terminal สร้าง parent directories โดยอัตโนมัติ จะเขียนทับไฟล์ทั้งหมด - ใช้ 'patch' สำหรับการแก้ไขแบบเจาะจง

Code Example

web:
  backend: firecrawl    # firecrawl | parallel | tavily | exa
RAW_BUFFERClick to expand / collapse

📄 reference/tools-reference.md


sidebar_position: 3 title: "เอกสารอ้างอิงเครื่องมือในตัว" description: "แหล่งอ้างอิงที่เชื่อถือได้สำหรับเครื่องมือในตัวของ Hermes โดยจัดกลุ่มตามชุดเครื่องมือ"

เอกสารอ้างอิงเครื่องมือในตัว

หน้านี้บันทึกเครื่องมือในตัวทั้งหมด 55 รายการในทะเบียนเครื่องมือ Hermes โดยจัดกลุ่มตามชุดเครื่องมือ ความพร้อมใช้งานขึ้นอยู่กับแพลตฟอร์ม, ข้อมูลรับรอง (credentials), และชุดเครื่องมือที่เปิดใช้งาน

สรุปจำนวนโดยย่อ: เครื่องมือ browser 12 รายการ, เครื่องมือ file 4 รายการ, เครื่องมือ RL 10 รายการ, เครื่องมือ Home Assistant 4 รายการ, เครื่องมือ terminal 2 รายการ, เครื่องมือ web 2 รายการ, เครื่องมือ Feishu 5 รายการ, และเครื่องมือ standalone 15 รายการในชุดเครื่องมืออื่น ๆ

:::tip MCP Tools นอกเหนือจากเครื่องมือในตัวแล้ว Hermes ยังสามารถโหลดเครื่องมือจากเซิร์ฟเวอร์ MCP ได้แบบไดนามิก เครื่องมือ MCP จะปรากฏพร้อมคำนำหน้าชื่อเซิร์ฟเวอร์ (เช่น github_create_issue สำหรับเซิร์ฟเวอร์ MCP github) ดู MCP Integration สำหรับการกำหนดค่า :::

browser toolset

ToolDescriptionRequires environment
browser_backนำทางกลับไปยังหน้าก่อนหน้าในประวัติเบราว์เซอร์ ต้องเรียกใช้ browser_navigate ก่อน
browser_cdpส่งคำสั่ง Chrome DevTools Protocol (CDP) ดิบ เป็นทางออกสำหรับปฏิบัติการเบราว์เซอร์ที่ไม่ได้ครอบคลุมโดย browser_navigate, browser_click, browser_console, ฯลฯ มีให้ใช้เมื่อปลายทาง CDP สามารถเข้าถึงได้เมื่อเริ่มเซสชัน - ผ่าน /browser connect หรือการกำหนดค่า browser.cdp_url ดู https://chromedevtools.github.io/devtools-protocol/
browser_dialogตอบสนองต่อ dialog ของ JavaScript แบบ native (alert / confirm / prompt / beforeunload) ต้องเรียกใช้ browser_snapshot ก่อน - dialog ที่รอดำเนินการจะปรากฏใน field pending_dialogs ของมัน จากนั้นเรียกใช้ `browser_dialog(action='accept''dismiss')มีความพร้อมใช้งานเหมือนกับbrowser_cdp(Browserbase หรือ/browser connect`)
browser_clickคลิกที่ element ที่ระบุด้วย ref ID จาก snapshot (เช่น '@e5') ref ID จะแสดงในวงเล็บเหลี่ยมใน output ของ snapshot ต้องเรียกใช้ browser_navigate และ browser_snapshot ก่อน
browser_consoleรับ output ของ console ของเบราว์เซอร์และข้อผิดพลาด JavaScript จากหน้าปัจจุบัน ส่งคืนข้อความ console.log/warn/error/info และข้อยกเว้น JS ที่ไม่ได้ถูกจับ ใช้สิ่งนี้เพื่อตรวจจับข้อผิดพลาด JavaScript แบบเงียบ, การเรียก API ล้มเหลว, และคำเตือนของแอปพลิเคชัน Requi…
browser_get_imagesรับรายการรูปภาพทั้งหมดในหน้าปัจจุบันพร้อม URL และ alt text มีประโยชน์สำหรับการค้นหารูปภาพเพื่อวิเคราะห์ด้วย vision tool ต้องเรียกใช้ browser_navigate ก่อน
browser_navigateนำทางไปยัง URL ในเบราว์เซอร์ เริ่มต้นเซสชันและโหลดหน้า ต้องเรียกใช้ก่อนเครื่องมือเบราว์เซอร์อื่น ๆ สำหรับการดึงข้อมูลทั่วไป ให้ใช้ web_search หรือ web_extract จะดีกว่า (เร็วกว่า, ถูกกว่า) ใช้เครื่องมือเบราว์เซอร์เมื่อคุณต้องการ…
browser_pressกดปุ่มคีย์บอร์ด มีประโยชน์สำหรับการส่งฟอร์ม (Enter), การนำทาง (Tab), หรือคีย์ลัด ต้องเรียกใช้ browser_navigate ก่อน
browser_scrollเลื่อนหน้าในทิศทาง ใช้สิ่งนี้เพื่อเปิดเผยเนื้อหาเพิ่มเติมที่อาจอยู่ต่ำกว่าหรือเหนือ viewport ปัจจุบัน ต้องเรียกใช้ browser_navigate ก่อน
browser_snapshotรับ snapshot แบบข้อความของ accessibility tree ของหน้าปัจจุบัน ส่งคืน interactive elements พร้อม ref ID (เช่น @e1, @e2) สำหรับ browser_click และ browser_type full=false (ค่าเริ่มต้น): มุมมองแบบกระชับพร้อม interactive elements. full=true: comp…
browser_typeพิมพ์ข้อความลงใน input field ที่ระบุด้วย ref ID ล้าง field ก่อน จากนั้นพิมพ์ข้อความใหม่ ต้องเรียกใช้ browser_navigate และ browser_snapshot ก่อน
browser_visionถ่ายภาพหน้าจอของหน้าปัจจุบันและวิเคราะห์ด้วย vision AI ใช้สิ่งนี้เมื่อคุณต้องการทำความเข้าใจด้วยสายตาว่ามีอะไรอยู่ในหน้า - มีประโยชน์อย่างยิ่งสำหรับ CAPTCHAs, ความท้าทายการตรวจสอบด้วยภาพ, layout ที่ซับซ้อน, หรือเมื่อข้อความ snap…

clarify toolset

ToolDescriptionRequires environment
clarifyถามผู้ใช้คำถามเมื่อคุณต้องการความชัดเจน, ข้อเสนอแนะ, หรือการตัดสินใจก่อนดำเนินการต่อ รองรับสองโหมด: 1. Multiple choice - ให้ตัวเลือกได้สูงสุด 4 ตัวเลือก ผู้ใช้เลือกหนึ่งตัวเลือกหรือพิมพ์คำตอบของตนเองผ่านตัวเลือก 'Other' ลำดับที่ 5 2.…

code_execution toolset

ToolDescriptionRequires environment
execute_codeรันสคริปต์ Python ที่สามารถเรียกใช้เครื่องมือ Hermes ได้แบบโปรแกรม ใช้เมื่อคุณต้องการการเรียกใช้เครื่องมือ 3 ครั้งขึ้นไปพร้อมตรรกะการประมวลผลระหว่างกัน, ต้องการกรอง/ลดผลลัพธ์เครื่องมือขนาดใหญ่ก่อนที่ข้อมูลจะเข้าสู่ context ของคุณ, ต้องการการแตกกิ่งแบบมีเงื่อนไข (…

cronjob toolset

ToolDescriptionRequires environment
cronjobตัวจัดการงานตามกำหนดเวลาแบบรวมศูนย์ ใช้ action="create", "list", "update", "pause", "resume", "run", หรือ "remove" เพื่อจัดการงาน รองรับงานที่ผูกกับ skill ด้วย skill หนึ่งรายการหรือมากกว่า และการอัปเดตด้วย skills=[] จะล้าง skill ที่แนบมา การรัน Cron จะเกิดขึ้นในเซสชันใหม่ที่ไม่มี context ของแชทปัจจุบัน

delegation toolset

ToolDescriptionRequires environment
delegate_taskสร้าง subagent หนึ่งตัวหรือมากกว่าเพื่อทำงานในงานต่าง ๆ ใน context ที่แยกออกไป แต่ละ subagent จะได้รับ conversation, terminal session, และ toolset ของตัวเอง มีเพียงสรุปสุดท้ายเท่านั้นที่ส่งกลับมา -- ผลลัพธ์เครื่องมือระหว่างทางจะไม่เข้าสู่ context window ของคุณเลย TWO…

feishu_doc toolset

จำกัดขอบเขตสำหรับตัวจัดการการตอบกลับอัจฉริยะของความคิดเห็นในเอกสาร Feishu (gateway/platforms/feishu_comment.py) ไม่ได้เปิดใช้งานบน hermes-cli หรือตัวปรับใช้แชท Feishu ทั่วไป

ToolDescriptionRequires environment
feishu_doc_readอ่านเนื้อหาข้อความทั้งหมดของเอกสาร Feishu/Lark (Docx, Doc, หรือ Sheet) โดยระบุ file_type และ tokenFeishu app credentials

feishu_drive toolset

จำกัดขอบเขตสำหรับตัวจัดการความคิดเห็นในเอกสาร Feishu ทำการอ่าน/เขียนความคิดเห็นบนไฟล์ไดรฟ์

ToolDescriptionRequires environment
feishu_drive_add_commentเพิ่มความคิดเห็นระดับบนสุดบนเอกสารหรือไฟล์ Feishu/LarkFeishu app credentials
feishu_drive_list_commentsแสดงความคิดเห็นทั้งเอกสารบนไฟล์ Feishu/Lark โดยแสดงรายการล่าสุดก่อนFeishu app credentials
feishu_drive_list_comment_repliesแสดงการตอบกลับในเธรดความคิดเห็น Feishu เฉพาะ (ทั้งเอกสารหรือส่วนที่เลือก)Feishu app credentials
feishu_drive_reply_commentโพสต์การตอบกลับในเธรดความคิดเห็น Feishu พร้อมการ mention ด้วย @ (ถ้ามี)Feishu app credentials

file toolset

ToolDescriptionRequires environment
patchการแก้ไขแบบ find-and-replace ที่เจาะจงในไฟล์ ใช้สิ่งนี้แทน sed/awk ใน terminal ใช้ fuzzy matching (9 กลยุทธ์) ดังนั้นความแตกต่างเล็กน้อยของ whitespace/indentation จะไม่ทำให้เกิดข้อผิดพลาด ส่งคืน unified diff จะรันการตรวจสอบไวยากรณ์โดยอัตโนมัติหลังการแก้ไข…
read_fileอ่านไฟล์ข้อความพร้อมหมายเลขบรรทัดและการแบ่งหน้า ใช้สิ่งนี้แทน cat/head/tail ใน terminal รูปแบบเอาต์พุต: 'LINE_NUM|CONTENT' แนะนำชื่อไฟล์ที่คล้ายกันหากไม่พบ ใช้ offset และ limit สำหรับไฟล์ขนาดใหญ่ หมายเหตุ: ไม่สามารถอ่านรูปภาพได้…
search_filesค้นหาเนื้อหาไฟล์หรือค้นหาไฟล์ตามชื่อ ใช้สิ่งนี้แทน grep/rg/find/ls ใน terminal ใช้ ripgrep-backed เร็วกว่าเทียบเท่าใน shell การค้นหาเนื้อหา (target='content'): ค้นหา Regex ภายในไฟล์ โหมดเอาต์พุต: การจับคู่ทั้งหมดพร้อมหมายเลขบรรทัด…
write_fileเขียนเนื้อหาลงในไฟล์ โดยแทนที่เนื้อหาเดิมทั้งหมด ใช้สิ่งนี้แทน echo/cat heredoc ใน terminal สร้าง parent directories โดยอัตโนมัติ จะเขียนทับไฟล์ทั้งหมด - ใช้ 'patch' สำหรับการแก้ไขแบบเจาะจง

homeassistant toolset

ToolDescriptionRequires environment
ha_call_serviceเรียกใช้บริการ Home Assistant เพื่อควบคุมอุปกรณ์ ใช้ ha_list_services เพื่อค้นหาบริการที่มีอยู่และพารามิเตอร์สำหรับแต่ละ domain
ha_get_stateรับสถานะโดยละเอียดของ entity ของ Home Assistant เพียงรายการเดียว รวมถึง attributes ทั้งหมด (ความสว่าง, สี, อุณหภูมิที่ตั้งไว้, การอ่านค่าเซ็นเซอร์, ฯลฯ)
ha_list_entitiesแสดงรายการ entity ของ Home Assistant สามารถกรองตาม domain (light, switch, climate, sensor, binary_sensor, cover, fan, ฯลฯ) หรือตามชื่อพื้นที่ (ห้องนั่งเล่น, ห้องครัว, ห้องนอน, ฯลฯ)
ha_list_servicesแสดงรายการบริการ (actions) ของ Home Assistant ที่พร้อมใช้งานสำหรับการควบคุมอุปกรณ์ แสดงว่าสามารถดำเนินการใดได้บ้างบนอุปกรณ์แต่ละประเภทและพารามิเตอร์ที่พวกมันยอมรับ ใช้สิ่งนี้เพื่อค้นหาว่าจะควบคุมอุปกรณ์ที่พบผ่าน ha_list_entities ได้อย่างไร

:::note Honcho tools (honcho_profile, honcho_search, honcho_context, honcho_reasoning, honcho_conclude) ไม่ได้เป็นเครื่องมือในตัวอีกต่อไป มีให้ใช้งานผ่านปลั๊กอิน Honcho memory provider ที่ plugins/memory/honcho/ ดู Memory Providers สำหรับการติดตั้งและการใช้งาน :::

image_gen toolset

ToolDescriptionRequires environment
image_generateสร้างรูปภาพคุณภาพสูงจากข้อความ prompt โดยใช้ FAL.ai โมเดลพื้นฐานจะถูกกำหนดค่าโดยผู้ใช้ (ค่าเริ่มต้น: FLUX 2 Klein 9B, สร้างภายใน 1 วินาที) และไม่สามารถเลือกได้โดย agent ส่งคืน URL รูปภาพเดียว แสดงผลโดยใช้…FAL_KEY

memory toolset

ToolDescriptionRequires environment
memoryบันทึกข้อมูลสำคัญลงในหน่วยความจำถาวรที่อยู่รอดข้ามเซสชัน หน่วยความจำของคุณจะปรากฏใน system prompt เมื่อเริ่มเซสชัน -- เป็นวิธีที่คุณจดจำสิ่งต่าง ๆ เกี่ยวกับผู้ใช้และสภาพแวดล้อมของคุณระหว่างการสนทนา WHEN TO SA…

messaging toolset

ToolDescriptionRequires environment
send_messageส่งข้อความไปยังแพลตฟอร์มการส่งข้อความที่เชื่อมต่อ หรือแสดงรายการปลายทางที่มีอยู่ สำคัญ: เมื่อผู้ใช้ขอส่งไปยังช่องหรือบุคคลที่เฉพาะเจาะจง (ไม่ใช่แค่ชื่อแพลตฟอร์มเปล่า ๆ) ให้เรียกใช้ send_message(action='list') ก่อนเพื่อดูปลายทางที่มีอยู่ tar…

moa toolset

ToolDescriptionRequires environment
mixture_of_agentsส่งปัญหาที่ยากผ่าน LLM แนวหน้าหลายตัวแบบร่วมมือกัน ทำการเรียกใช้ API 5 ครั้ง (4 reference models + 1 aggregator) ด้วยความพยายามในการให้เหตุผลสูงสุด -- ใช้เมื่อจำเป็นสำหรับปัญหาที่ยากจริง ๆ เหมาะสำหรับ: คณิตศาสตร์ที่ซับซ้อน, advanced alg…OPENROUTER_API_KEY

rl toolset

ToolDescriptionRequires environment
rl_check_statusรับสถานะและเมตริกสำหรับการรันการฝึกอบรม RATE LIMITED: บังคับให้มีช่วงเวลาขั้นต่ำ 30 นาทีระหว่างการตรวจสอบสำหรับรันเดียวกัน ส่งคืนเมตริก WandB: step, state, reward_mean, loss, percent_correctTINKER_API_KEY, WANDB_API_KEY
rl_edit_configอัปเดต field การกำหนดค่า ใช้ rl_get_current_config() ก่อนเพื่อดู field ทั้งหมดที่พร้อมใช้งานสำหรับ environment ที่เลือก แต่ละ environment มีตัวเลือกที่กำหนดค่าได้แตกต่างกัน การตั้งค่าโครงสร้างพื้นฐาน (tokenizer, URLs, lora_rank, learning_ra…TINKER_API_KEY, WANDB_API_KEY
rl_get_current_configรับการกำหนดค่า environment ปัจจุบัน ส่งคืนเฉพาะ field ที่สามารถแก้ไขได้: group_size, max_token_length, total_steps, steps_per_eval, use_wandb, wandb_name, max_num_workersTINKER_API_KEY, WANDB_API_KEY
rl_get_resultsรับผลลัพธ์และเมตริกสุดท้ายสำหรับการรันการฝึกอบรมที่เสร็จสมบูรณ์ ส่งคืนเมตริกสุดท้ายและ path ไปยัง weights ที่ได้รับการฝึกอบรมTINKER_API_KEY, WANDB_API_KEY
rl_list_environmentsแสดงรายการ environment RL ทั้งหมดที่มีอยู่ ส่งคืนชื่อ environment, path, และคำอธิบาย เคล็ดลับ: อ่าน file_path ด้วย file tools เพื่อทำความเข้าใจว่าแต่ละ environment ทำงานอย่างไร (verifiers, data loading, rewards)TINKER_API_KEY, WANDB_API_KEY
rl_list_runsแสดงรายการการรันการฝึกอบรมทั้งหมด (ที่กำลังทำงานและที่เสร็จสมบูรณ์) พร้อมสถานะTINKER_API_KEY, WANDB_API_KEY
rl_select_environmentเลือก environment RL สำหรับการฝึกอบรม โหลดการกำหนดค่าเริ่มต้นของ environment หลังจากเลือกแล้ว ให้ใช้ rl_get_current_config() เพื่อดูการตั้งค่า และ rl_edit_config() เพื่อแก้ไขTINKER_API_KEY, WANDB_API_KEY
rl_start_trainingเริ่มการรันการฝึกอบรม RL ใหม่ด้วย environment และ config ปัจจุบัน พารามิเตอร์การฝึกอบรมส่วนใหญ่ (lora_rank, learning_rate, ฯลฯ) ถูกกำหนดไว้แล้ว ใช้ rl_edit_config() เพื่อตั้งค่า group_size, batch_size, wandb_project ก่อนเริ่ม คำเตือน: การฝึกอบรม…TINKER_API_KEY, WANDB_API_KEY
rl_stop_trainingหยุดงานการฝึกอบรมที่กำลังทำงาน ใช้เมื่อเมตริกดูไม่ดี, การฝึกอบรมหยุดนิ่ง, หรือคุณต้องการลองการตั้งค่าที่แตกต่างกันTINKER_API_KEY, WANDB_API_KEY
rl_test_inferenceการทดสอบ inference อย่างรวดเร็วสำหรับทุก environment รันขั้นตอน inference + scoring สองสามขั้นตอนโดยใช้ OpenRouter ค่าเริ่มต้น: 3 steps x 16 completions = 48 rollouts ต่อ model, ทดสอบ 3 models = 144 รวม ทดสอบการโหลด environment, การสร้าง prompt, ใน…TINKER_API_KEY, WANDB_API_KEY

session_search toolset

ToolDescriptionRequires environment
session_searchค้นหาหน่วยความจำระยะยาวของการสนทนาในอดีต นี่คือการเรียกคืนข้อมูลของคุณ -- ทุกเซสชันที่ผ่านมาสามารถค้นหาได้ และเครื่องมือนี้จะสรุปสิ่งที่เกิดขึ้น ควรใช้สิ่งนี้เชิงรุกเมื่อ: - ผู้ใช้พูดว่า 'เราเคยทำสิ่งนี้มาก่อน', 'จำได้ไหม', 'ครั้งที่แล้ว…

skills toolset

ToolDescriptionRequires environment
skill_manageจัดการ skills (สร้าง, อัปเดต, ลบ) Skills คือหน่วยความจำเชิงกระบวนการของคุณ -- แนวทางที่นำกลับมาใช้ใหม่สำหรับประเภทงานที่เกิดขึ้นซ้ำ ๆ Skills ใหม่จะไปที่ ~/.hermes/skills/; skills ที่มีอยู่สามารถแก้ไขได้ไม่ว่าจะอยู่ที่ใด การดำเนินการ: create (full SKILL.m…
skill_viewSkills ช่วยให้สามารถโหลดข้อมูลเกี่ยวกับงานและ workflow เฉพาะ รวมถึงสคริปต์และเทมเพลต โหลดเนื้อหาทั้งหมดของ skill หรือเข้าถึงไฟล์ที่เชื่อมโยง (references, templates, scripts) การเรียกใช้ครั้งแรกจะส่งคืนเนื้อหา SKILL.md บวกกับ…
skills_listแสดงรายการ skills ที่พร้อมใช้งาน (ชื่อ + คำอธิบาย) ใช้ skill_view(name) เพื่อโหลดเนื้อหาทั้งหมด

terminal toolset

ToolDescriptionRequires environment
processจัดการ process พื้นหลังที่เริ่มด้วย terminal(background=true) การดำเนินการ: 'list' (แสดงทั้งหมด), 'poll' (ตรวจสอบสถานะ + เอาต์พุตใหม่), 'log' (เอาต์พุตเต็มพร้อมการแบ่งหน้า), 'wait' (บล็อกจนกว่าจะเสร็จหรือหมดเวลา), 'kill' (ยุติ), 'write' (sen…
terminalรันคำสั่ง shell บนสภาพแวดล้อม Linux ระบบไฟล์จะคงอยู่ระหว่างการเรียกใช้ ตั้งค่า background=true สำหรับเซิร์ฟเวอร์ที่ทำงานนาน ตั้งค่า notify_on_complete=true (พร้อมกับ background=true) เพื่อรับการแจ้งเตือนอัตโนมัติเมื่อ process เสร็จสิ้น -- ไม่จำเป็นต้อง poll ห้ามใช้ cat/head/tail -- ให้ใช้ read_file ห้ามใช้ grep/rg/find -- ให้ใช้ search_files

todo toolset

ToolDescriptionRequires environment
todoจัดการรายการงานของคุณสำหรับเซสชันปัจจุบัน ใช้สำหรับงานที่ซับซ้อนที่มี 3 ขั้นตอนขึ้นไป หรือเมื่อผู้ใช้ให้งานหลายอย่าง เรียกใช้โดยไม่มีพารามิเตอร์เพื่ออ่านรายการปัจจุบัน การเขียน: - ให้ 'todos' array เพื่อสร้าง/อัปเดตรายการ - merge=…

vision toolset

ToolDescriptionRequires environment
vision_analyzeวิเคราะห์รูปภาพโดยใช้ AI vision ให้คำอธิบายที่ครอบคลุมและตอบคำถามเฉพาะเกี่ยวกับเนื้อหาของรูปภาพ

web toolset

ToolDescriptionRequires environment
web_searchค้นหาข้อมูลบนเว็บในหัวข้อใด ๆ ส่งคืนผลลัพธ์ที่เกี่ยวข้องสูงสุด 5 รายการพร้อมชื่อเรื่อง, URL, และคำอธิบายEXA_API_KEY or PARALLEL_API_KEY or FIRECRAWL_API_KEY or TAVILY_API_KEY
web_extractดึงเนื้อหาจาก URL ของหน้าเว็บ ส่งคืนเนื้อหาหน้าในรูปแบบ markdown นอกจากนี้ยังใช้งานได้กับ URL ของ PDF -- ส่งลิงก์ PDF โดยตรงและระบบจะแปลงเป็นข้อความ markdown หน้าที่มีขนาดต่ำกว่า 5000 ตัวอักษรจะส่งคืน markdown เต็ม; หน้าที่ใหญ่กว่าจะถูกสรุปโดย LLMEXA_API_KEY or PARALLEL_API_KEY or FIRECRAWL_API_KEY or TAVILY_API_KEY

tts toolset

ToolDescriptionRequires environment
text_to_speechแปลงข้อความเป็นเสียงพูด ส่งคืน path MEDIA: ที่แพลตฟอร์มส่งมอบเป็นข้อความเสียง ใน Telegram จะเล่นเป็น voice bubble, ใน Discord/WhatsApp เป็นไฟล์แนบเสียง ในโหมด CLI จะบันทึกที่ ~/voice-memos/. Voice and provider…

📄 integrations/index.md


title: "Integrations" sidebar_label: "Overview" sidebar_position: 0

การเชื่อมต่อ (Integrations)

Hermes Agent เชื่อมต่อกับระบบภายนอกสำหรับการอนุมาน AI, tool servers, workflow ของ IDE, การเข้าถึงแบบโปรแกรม, และอื่น ๆ การเชื่อมต่อเหล่านี้ช่วยขยายขีดความสามารถของ Hermes และขอบเขตที่สามารถทำงานได้

AI Providers & Routing

Hermes รองรับ AI inference providers หลายรายได้ทันที ใช้ hermes model เพื่อตั้งค่าแบบโต้ตอบ หรือตั้งค่าใน config.yaml

  • AI Providers - OpenRouter, Anthropic, OpenAI, Google, และ endpoint ที่เข้ากันได้กับ OpenAI ทุกตัว Hermes จะตรวจจับความสามารถต่าง ๆ เช่น vision, streaming, และ tool use สำหรับแต่ละ provider โดยอัตโนมัติ
  • Provider Routing - การควบคุมระดับละเอียดว่า provider ใดที่อยู่เบื้องหลังจะจัดการคำขอ OpenRouter ของคุณได้อย่างไร ปรับให้เหมาะสมสำหรับต้นทุน, ความเร็ว, หรือคุณภาพ ด้วยการจัดเรียง (sorting), whitelists, blacklists, และการกำหนดลำดับความสำคัญที่ชัดเจน
  • Fallback Providers - การสลับไปใช้ LLM providers สำรองโดยอัตโนมัติเมื่อ primary model ของคุณพบข้อผิดพลาด รวมถึงการ fallback ของ primary model และการ fallback งานเสริมอิสระสำหรับ vision, compression, และ web extraction

Tool Servers (MCP)

  • MCP Servers - เชื่อมต่อ Hermes กับ external tool servers ผ่าน Model Context Protocol เข้าถึงเครื่องมือจาก GitHub, databases, file systems, browser stacks, internal APIs, และอื่น ๆ โดยไม่ต้องเขียนเครื่องมือ Hermes แบบ native รองรับทั้ง stdio และ SSE transports, การกรองเครื่องมือต่อ server, และการลงทะเบียน resource/prompt ที่รับรู้ความสามารถ (capability-aware)

Web Search Backends

เครื่องมือ web_search และ web_extract รองรับ backend providers สี่ราย ซึ่งตั้งค่าผ่าน config.yaml หรือ hermes tools:

BackendEnv VarSearchExtractCrawl
Firecrawl (default)FIRECRAWL_API_KEY
ParallelPARALLEL_API_KEY-
TavilyTAVILY_API_KEY
ExaEXA_API_KEY-

ตัวอย่างการตั้งค่าอย่างรวดเร็ว:

web:
  backend: firecrawl    # firecrawl | parallel | tavily | exa

หากไม่ได้ตั้งค่า web.backend ระบบจะตรวจจับ backend โดยอัตโนมัติจาก API key ที่พร้อมใช้งาน นอกจากนี้ยังรองรับ Self-hosted Firecrawl ผ่าน FIRECRAWL_API_URL

Browser Automation

Hermes มีระบบ browser automation เต็มรูปแบบ พร้อมตัวเลือก backend หลายตัวสำหรับการเรียกดูเว็บไซต์, การกรอกฟอร์ม, และการดึงข้อมูล:

  • Browserbase - Managed cloud browsers พร้อมเครื่องมือ anti-bot, การแก้ CAPTCHA, และ residential proxies
  • Browser Use - Alternative cloud browser provider
  • Local Chrome via CDP - เชื่อมต่อกับ instance ของ Chrome ที่กำลังทำงานอยู่โดยใช้ /browser connect
  • Local Chromium - browser local แบบ headless ผ่าน CLI agent-browser

ดู Browser Automation สำหรับการตั้งค่าและการใช้งาน

Voice & TTS Providers

Text-to-speech และ speech-to-text สำหรับทุกแพลตฟอร์มการส่งข้อความ:

| Provider | Quality | Cost | API Key | ||----------|---------|------|---------| || Edge TTS (default) | Good | Free | None needed | || ElevenLabs | Excellent | Paid | ELEVENLABS_API_KEY | || OpenAI TTS | Good | Paid | VOICE_TOOLS_OPENAI_KEY | || MiniMax | Good | Paid | MINIMAX_API_KEY | || NeuTTS | Good | Free | None needed |

Speech-to-text รองรับสาม providers: local Whisper (ฟรี, ทำงานบนอุปกรณ์), Groq (cloud ที่รวดเร็ว), และ OpenAI Whisper API การถอดเสียงข้อความเสียงทำงานได้กับ Telegram, Discord, WhatsApp, และแพลตฟอร์มการส่งข้อความอื่น ๆ ดู Voice & TTS และ Voice Mode สำหรับรายละเอียด

IDE & Editor Integration

  • IDE Integration (ACP) - ใช้ Hermes Agent ภายใน editor ที่รองรับ ACP เช่น VS Code, Zed, และ JetBrains Hermes ทำงานเป็น ACP server โดยแสดงผลข้อความแชท, activity ของเครื่องมือ, file diffs, และคำสั่ง terminal ภายใน editor ของคุณ

Programmatic Access

  • API Server - เปิดเผย Hermes เป็น HTTP endpoint ที่เข้ากันได้กับ OpenAI frontend ใด ๆ ที่ใช้รูปแบบ OpenAI - เช่น Open WebUI, LobeChat, LibreChat, NextChat, ChatBox - สามารถเชื่อมต่อและใช้ Hermes เป็น backend พร้อมชุดเครื่องมือทั้งหมด

Memory & Personalization

  • Built-in Memory - หน่วยความจำถาวรที่คัดสรรมาผ่านไฟล์ MEMORY.md และ USER.md agent จะเก็บข้อมูลบันทึกส่วนตัวและข้อมูลโปรไฟล์ผู้ใช้ในรูปแบบที่จำกัด ซึ่งยังคงอยู่แม้จะข้าม session
  • Memory Providers - เสียบ external memory backends เพื่อการปรับแต่งส่วนบุคคลที่ลึกขึ้น รองรับเจ็ด providers: Honcho (dialectic reasoning), OpenViking (tiered retrieval), Mem0 (cloud extraction), Hindsight (knowledge graphs), Holographic (local SQLite), RetainDB (hybrid search), และ ByteRover (CLI-based)

Messaging Platforms

Hermes ทำงานเป็น gateway bot บนแพลตฟอร์มการส่งข้อความกว่า 15 แพลตฟอร์ม โดยทั้งหมดถูกตั้งค่าผ่าน subsystem gateway เดียวกัน:

ดู Messaging Gateway overview สำหรับตารางเปรียบเทียบแพลตฟอร์มและคู่มือการตั้งค่า

Home Automation

  • Home Assistant - ควบคุมอุปกรณ์ smart home ผ่านเครื่องมือเฉพาะสี่ตัว (ha_list_entities, ha_get_state, ha_list_services, ha_call_service) ชุดเครื่องมือ Home Assistant จะเปิดใช้งานโดยอัตโนมัติเมื่อมีการตั้งค่า HASS_TOKEN

Plugins

  • Plugin System - ขยาย Hermes ด้วยเครื่องมือที่กำหนดเอง, lifecycle hooks, และคำสั่ง CLI โดยไม่ต้องแก้ไข core code Plugins จะถูกค้นพบจาก ~/.hermes/plugins/, .hermes/plugins/ แบบ local ของโปรเจกต์, และ pip-installed entry points
  • Build a Plugin - คู่มือทีละขั้นตอนสำหรับการสร้าง Hermes plugins ที่มีเครื่องมือ, hooks, และคำสั่ง CLI

Training & Evaluation

  • RL Training - สร้าง trajectory data จาก session ของ agent สำหรับ reinforcement learning และ model fine-tuning รองรับ Atropos environments ด้วย reward functions ที่ปรับแต่งได้
  • Batch Processing - รัน agent ข้าม prompts หลายร้อยรายการแบบขนาน สร้าง trajectory data รูปแบบ ShareGPT ที่มีโครงสร้างสำหรับการสร้างข้อมูลฝึกอบรมหรือการประเมินผล

extent analysis

TL;DR

The issue seems to be related to the documentation of Hermes tools and integrations, but without a specific problem statement, it's challenging to provide a direct fix; however, a likely step involves reviewing and updating the documentation to ensure clarity and accuracy.

Guidance

  1. Review Documentation: Carefully go through the provided documentation to identify any inconsistencies, outdated information, or areas that lack clarity.
  2. Update Tool Descriptions: Ensure each tool's description accurately reflects its functionality, requirements, and any limitations.
  3. Check Integration Details: Verify that all integration setups, including API keys and backend configurations, are correctly documented and up-to-date.
  4. Test Tools and Integrations: Perform tests on a selection of tools and integrations to validate their functionality as described in the documentation.

Example

Given the extensive nature of the documentation, an example of how to improve it could involve reorganizing sections for better readability or adding more detailed explanations of complex tools like browser_cdp or rl_start_training.

Notes

  • The documentation appears comprehensive but lacks a clear issue to address.
  • Ensuring the documentation's accuracy and clarity is crucial for users to effectively utilize Hermes' tools and integrations.

Recommendation

Apply a thorough review and update process to the documentation, focusing on clarity, accuracy, and completeness, to enhance user experience and facilitate the effective use of Hermes' capabilities.

Vote matrix · Quick signals

Works
Did the solution work? Tap to confirm.
Easy Fix
Was it a quick fix?
Time Saver
Did it save you time?
Blocking
Was it severely blocking?
Common Issue
Are others likely hitting this too?
Flaky / Intermittent
Is it intermittent?
Verified / Reproducible
Can you reproduce it reliably?
Loading…

Still need to ship something?

×6

Another batch ranked right after the header list — different links, same matching logic.

Back to top recommendations

TRENDING