OpenAI
Paradigm๊ณผ ํ๋ ฅํด EVMbench ๋ฐํ
(์ค๋งํธ ์ปจํธ๋ํธ ์ทจ์ฝ์ ์ธก์ ํ๋ AI ๋ฒค์น๋งํฌ)
์ธ๊ฐ์ง์ ํ๊ฐ ํญ๋ชฉ
ํ์ง(Detect), ์์ (Patch), ๊ณต๊ฒฉ(Exploit)
AI๊ฐ ์ด์ ์ค๋งํธ์ปจํธ๋ํธ๋ฅผ ๊ฐ์ฌํ๋ ์์ค์ ๋์ด์
์ค์ ๋ก ์๊ธ ํ์ทจ๊น์ง ์๋ ์คํํ๋ ๋จ๊ณ๊น์ง ๋๋ฌ
Exploit ๋ชจ๋์์ 6๊ฐ์ ์ GPT-5๋ 31.9% ์์
GPT-5.3-Codex๋ 72.2% ๊ธฐ๋กํ์ฌ ๋น ๋ฅด๊ฒ ์งํ์ค
AI ๊ธฐ๋ฐ ์๋ ๊ฐ์ฌ ์์ด์ ํธ ์๋ ์ง์
๐ ํธ์ / ๐ Blog

645
5์๊ฐ ์