π₯π₯
Sentient, AI μμ΄μ νΈμ μ€ν¬μ λ°λ³΅μ μΌλ‘ μ§νμν€λ μλ μ±λ₯κ°μ νλ μμν¬ '
EvoSkill V1' μΆμ
EvoSkill V1 μ΄λ?
EvoSkill V1 μ΄λ?
- νμ€μμ½ : μμ΄μ νΈκ° κΈ°μ‘΄μ μ€ν¨λ€μ λ°νμΌλ‘ μ€μ€λ‘ νμ΅νκ³ κ°μ νλ μ€νμμ€ ν΄ν·
- μμ΄μ νΈκ° μ€μ μ€ν μ€ν¨(trajectory)μμ ν¨ν΄μ μ°Ύμ μ¬μ¬μ© κ°λ₯ν μ€ν¬μ μλμΌλ‘ μμ±, κ²μ¦, μ§ν
- μλ μ€ν¬ μ λ(Automated Skill Induction) νλ μμν¬
(μ€ν¬ = Markdown κΈ°λ° νλ μ΄λΆ)
- claude/skills/ ν΄λμ μ μ₯ -> Git λΈλμΉλ‘ λ²μ κ΄λ¦¬ λ° μ¬νμ± λ³΄μ₯
μλ λ°©μ
μλ λ°©μ
1. Base Agent : νμ¬ ν둬ννΈμ μ€ν¬λ‘ λ²€μΉλ§ν¬ λ¬Έμ ν΄μ
2. Proposer : μ€ν¨ μ¬λ‘λ₯Ό λΆμ, βμ΄λ€ μ€ν¬μ΄ νμν μ§β μ μ
3. Generator / Skill-Builder : μ€ν¬ νμΌ, μ§μΉ¨, 보쑰 μ€ν¬λ¦½νΈ λ±μ μμ±
4. Evaluato : μ λ²μ μ κ²μ¦ μΈνΈμμ νκ°
5. Frontierκ° μ±λ₯μ΄ μ’μ νλ‘κ·Έλ¨λ§ git branch ννλ‘ λ³΄μ‘΄
λ²€μΉλ§ν¬ κ²°κ³Ό
λ²€μΉλ§ν¬ κ²°κ³Ό
- OfficeQA : Claude Code + Opus 4.5 κΈ°μ€ exact-match accuracyκ° 60.6%μμ 67.9%λ‘ +7.3%p κ°μ
(λ―Έκ΅ μ¬λ¬΄λΆ λ°μ΄ν° κΈ°λ°μ grounded reasoning λ²€μΉλ§ν¬)
- SealQA : noisy retrievalμ΄ μμΈ search-augmented QA νκ²½μμ 26.6%μμ 38.7%λ‘ +12.1%p ν₯μ
- κ²μ μ λ΅μμ κ°μ₯ ν° κ°μ μ 보μ΄κ³ , λ€λ₯Έ μμ΄μ νΈλ€μμλ λΉμ·ν ν₯μμ νμΈ
κΉν : https://github.com/sentient-agi/EvoSkill
νΈμμλ¬Έ : https://x.com/SentientAGI/status/2047314636652032182
https://github.com/sentient-agi/EvoSkill
νΈμμλ¬Έ :
https://x.com/SentientAGI/status/2047314636652032182
μν°ν΄μ λ°λ₯΄λ©΄ μ½λ©λ± μ μ λ λμ λ²μλ‘ νμ₯ν μμ μ΄λ©° μ λλ μ€ν¬μ νμΈνλ λ°μ΄ν°λ‘ νμ©νλ λ±μ κ³νμ΄ μΈκΈλμ΄ μλλ°, μ λ°μ μΌλ‘ λλ¨ν μ€μ©μ μΈ λ°©ν₯μ±μ ν΄ν·μ΄λΌλ μκ°μ΄ λλ€μ.
#SENT #KOL