[2024] Retrieval Augmented Generation (RAG) and Beyond
2024.12.21.
ABSTRACT
์ธ๋ถ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ ์ค์ ๊ณผ์ ๋ฅผ ์ํํ๋ ๋ฐ ์์ด ๋ฐ์ด๋ ๋ฅ๋ ฅ์ ๋ณด์ฌ์ฃผ๊ณ ์์ต๋๋ค. ์ธ๋ถ ๋ฐ์ดํฐ๋ ๋ชจ๋ธ์ ํน์ ๋๋ฉ์ธ ์ ๋ฌธ์ฑ๊ณผ ์์์ฑ(= ์๊ฐ์ ์์ ์ ๋ํ ๊ด๋ จ์ฑ)์ ๊ฐํํ ๋ฟ ์๋๋ผ ํ๊ฐ(hallucination) ๋ฐ์์ ์ค์ฌ ๊ฒฐ๊ณผ๋ฌผ์ ์ ์ด ๊ฐ๋ฅ์ฑ๊ณผ ํด์ ๊ฐ๋ฅ์ฑ์ ๋์ด๋ ๋ฐ ๊ธฐ์ฌํฉ๋๋ค. ๊ฒ์ ๊ธฐ๋ฐ ์์ฑ (RAG, Retrieval-Augmented Generation) ๋ฐ ํ์ธํ๋๊ณผ ๊ฐ์ ์ธ๋ถ ๋ฐ์ดํฐ๋ฅผ LLM์ ํตํฉํ๋ ๊ธฐ์ ์ ์ ์ ๋ ์ฃผ๋ชฉ๋ฐ๊ณ ์์ผ๋ฉฐ, ๋ค์ํ ๋ถ์ผ์์ ๋๋ฆฌ ์์ฉ๋๊ณ ์์ต๋๋ค. ๊ทธ๋ผ์๋ ๋ถ๊ตฌํ๊ณ , ๋ฐ์ดํฐ๋ก ๊ฐํ๋ LLM์ ๋ค์ํ ์ ๋ฌธ ๋ถ์ผ์ ํจ๊ณผ์ ์ผ๋ก ๋ฐฐ์นํ๋ ๊ฒ์ ์ฌ์ ํ ํฐ ๋์ ๊ณผ์ ๋ก ๋จ์ ์์ต๋๋ค. ์ด๋ฌํ ๋์ ๊ณผ์ ๋ ๊ด๋ จ ๋ฐ์ดํฐ ๊ฒ์ ๋ฐ ์ฌ์ฉ์ ์๋ ํด์์์๋ถํฐ ๋ณต์กํ ๊ณผ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ LLM์ ์ถ๋ก ๋ฅ๋ ฅ์ ์จ์ ํ ํ์ฉํ๋ ๊ฒ์ ์ด๋ฅด๊ธฐ๊น์ง ๊ด๋ฒ์ํ ์์ญ์ ๊ฑธ์ณ ์์ต๋๋ค. ์ฐ๋ฆฌ๋ ๋ฐ์ดํฐ๋ก ๊ฐํ๋ LLM ์์ฉ์ ์์ด ๋ง๋ฅ ํด๊ฒฐ์ฑ ์ด ์กด์ฌํ์ง ์๋๋ค๊ณ ๋ฏฟ์ต๋๋ค. ์ค์ ๋ก ์ฑ๊ณผ ๋ถ์ง์ ์ข ์ข ์์ ์ ํต์ฌ ์ด์ ์ ์ฌ๋ฐ๋ฅด๊ฒ ํ์ ํ์ง ๋ชปํ๊ฑฐ๋, ์์ ์ด ๋ณธ์ง์ ์ผ๋ก ์ฌ๋ฌ ๋ฅ๋ ฅ์ ์กฐํฉํด์ผ ํ๋ ๊ฒฝ์ฐ๋ก ์ธํด ๋ฐ์ํฉ๋๋ค. ์ด๋ฌํ ๋ฅ๋ ฅ์ ๋ถ๋ฆฌํด ๋ฌธ์ ํด๊ฒฐ์ ์ต์ ํํ์ง ๋ชปํ๊ธฐ ๋๋ฌธ์ ๋๋ค.
์ด ๋ ผ๋ฌธ์์๋ RAG ์์ ๋ถ๋ฅ ๋ฐฉ๋ฒ ์ ์ ์ํ๋ฉฐ, ์ธ๋ถ ๋ฐ์ดํฐ์ ์ ํ๊ณผ ์์ ์ ์ฃผ์ ์ด์ ์ ๋ฐ๋ผ ์ฌ์ฉ์ ์ฟผ๋ฆฌ๋ฅผ ๋ค ๊ฐ์ง ์์ค์ผ๋ก ๋ถ๋ฅํฉ๋๋ค: ๋ช ์์ ์ฌ์ค ์ฟผ๋ฆฌ(= explicit fact query), ์์์ ์ฌ์ค ์ฟผ๋ฆฌ(= implicit fact query), ํด์ ๊ฐ๋ฅํ ๊ทผ๊ฑฐ ์ฟผ๋ฆฌ(= interpretable rationale query), ์จ๊ฒจ์ง ๊ทผ๊ฑฐ ์ฟผ๋ฆฌ(= hidden rationale query). ์ฐ๋ฆฌ๋ ์ด๋ฌํ ์ฟผ๋ฆฌ ์์ค์ ์ ์ํ๊ณ , ๊ด๋ จ ๋ฐ์ดํฐ์ ์ ์ ๊ณตํ๋ฉฐ, ์ด๋ฌํ ๊ณผ์ ๋ฅผ ํด๊ฒฐํ๋ ๋ฐ ์์ด ์ฃผ์ ๋์ ๊ณผ์ ์ ๊ฐ์ฅ ํจ๊ณผ์ ์ธ ๊ธฐ์ ์ ์์ฝํฉ๋๋ค. ๋ง์ง๋ง์ผ๋ก, ์ธ๋ถ ๋ฐ์ดํฐ๋ฅผ LLM์ ํตํฉํ๋ ์ธ ๊ฐ์ง ์ฃผ์ ํํ๋ฅผ ๋ ผ์ํฉ๋๋ค: ์ปจํ ์คํธ ์ ๊ณต, ์ํ ๋ชจ๋ธ ํ์ฉ, ํ์ธํ๋. ๊ฐ๊ฐ์ ๊ฐ์ , ํ๊ณ, ๊ทธ๋ฆฌ๊ณ ์ ํฉํ ๋ฌธ์ ์ ํ์ ๊ฐ์กฐํฉ๋๋ค. ๋ณธ ์ฐ๊ตฌ๋ ๋ ์๋ค์ด LLM ์์ฉ ๊ฐ๋ฐ ์ ๋ฐ์ดํฐ ์๊ตฌ ์ฌํญ๊ณผ ์ฃผ์ ๋ณ๋ชฉํ์์ ์ฒ ์ ํ ์ดํดํ๊ณ ๋ถํดํ ์ ์๋๋ก ๋๊ณ , ๋ค์ํ ๋์ ๊ณผ์ ์ ๋ํ ํด๊ฒฐ์ฑ ์ ์ ์ํ๋ฉฐ, ์ด๋ฌํ ์์ฉ์ ์ฒด๊ณ์ ์ผ๋ก ๊ฐ๋ฐํ๋ ๋ฐ ์์ด ๊ฐ์ด๋ ์ญํ ์ ํ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค.
1. Introduction
๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ ๊ด๋ฒ์ํ ์ธ๊ณ ์ง์๊ณผ ์ ๊ตํ ์ถ๋ก ๋ฅ๋ ฅ์ ํฌํจํ์ฌ ๋๋ผ์ด ์ญ๋์ ๋ณด์ฌ์ฃผ๊ณ ์์ต๋๋ค. ๊ทธ๋ฌ๋ ์ด๋ฌํ ๋ฐ์ ์๋ ๋ถ๊ตฌํ๊ณ , ๋ค์ํ ์ ๋ฌธ ๋ถ์ผ์ ํจ๊ณผ์ ์ผ๋ก ์ ์ฉํ๋ ๋ฐ๋ ์ฌ์ ํ ์ค์ํ ๊ณผ์ ๋ค์ด ์กด์ฌํฉ๋๋ค. ์ฌ๊ธฐ์๋ ๋ชจ๋ธ์ ํ๊ฐ(= hallucination), ํน์ ๋๋ฉ์ธ ์ง์๊ณผ์ ๋ถ์ผ์น(= misalignment with domain-specific knowledge) ๋ฑ๊ณผ ๊ฐ์ ๋ฌธ์ ๊ฐ ํฌํจ๋ฉ๋๋ค. ํนํ ์ด๊ธฐ ํ์ต ๋ฐ์ดํฐ์ ์ ํฌํจ๋์ง ์์ ๋น๊ณต๊ฐ ๋ฐ์ดํฐ๋ ์จํ๋ ๋ฏธ์ค ๋ฐ์ดํฐ์ ๊ฐ์ ๋๋ฉ์ธ๋ณ ๋ฐ์ดํฐ๋ฅผ ํตํฉํ๋ ๊ฒ์ ํน์ ์ฐ์ ์ ์๊ตฌ๋ฅผ ์ถฉ์กฑ์ํค๊ธฐ ์ํด LLM ์์ฉ ํ๋ก๊ทธ๋จ์ ๋ง์ถคํํ๋ ๋ฐ ๋งค์ฐ ์ค์ํฉ๋๋ค. ๊ฒ์ ๊ธฐ๋ฐ ์์ฑ(RAG) ๋ฐ ํ์ธํ๋๊ณผ ๊ฐ์ ๊ธฐ์ ์ ํตํด ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ LLM ์์ฉ ํ๋ก๊ทธ๋จ์ ๊ธฐ์กด์ ์ผ๋ฐ์ ์ธ LLM๋ง์ผ๋ก ๊ตฌ์ถ๋ ์์ฉ ํ๋ก๊ทธ๋จ์ ๋นํด ์ฌ๋ฌ ์ธก๋ฉด์์ ์ฐ์๋ฅผ ๋ณด์ฌ์ฃผ๊ณ ์์ต๋๋ค.
ํฅ์๋ ์ ๋ฌธ์ฑ๊ณผ ์์์ฑ (= Enhanced Professionalism and Timeliness) : LLM ํ์ต์ ์ฌ์ฉ๋ ๋ฐ์ดํฐ๋ ์์์ฑ์ด ๋ถ์กฑํ๊ฑฐ๋ ํน์ ๋๋ฉ์ธ์ ํฌ๊ด์ ์ผ๋ก ๋ค๋ฃจ์ง ๋ชปํ ์ ์์ผ๋ฉฐ, ํนํ ์ฌ์ฉ์๊ฐ ์์ ํ ๋ ์ ๋ฐ์ดํฐ๋ ํฌํจ๋์ง ์๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค. ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ LLM ์์ฉ ํ๋ก๊ทธ๋จ์ ๋ณต์กํ ์ง๋ฌธ์ ๋ํด ๋ณด๋ค ์์ธํ๊ณ ์ ํํ ๋ต๋ณ์ ์ ๊ณตํ๋ฉฐ, ๋ฐ์ดํฐ ์ ๋ฐ์ดํธ์ ๋ง์ถคํ๋ฅผ ๊ฐ๋ฅํ๊ฒ ํจ์ผ๋ก์จ ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํฉ๋๋ค.
๋๋ฉ์ธ ์ ๋ฌธ๊ฐ์์ ์ผ์น์ฑ (=Alignment with Domain Experts) : ๋๋ฉ์ธ๋ณ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ๊ณ ํ์ตํจ์ผ๋ก์จ ๋ฐ์ดํฐ๋ฅผ ๊ฐํํ LLM ์์ฉ ํ๋ก๊ทธ๋จ์ ์์ฌ๋ ๋ณํธ์ฌ์ ๊ฐ์ ๋๋ฉ์ธ ์ ๋ฌธ๊ฐ์ ๋ ๊ฐ๊น์ด ์ญ๋์ ๋ฐํํ ์ ์์ต๋๋ค.
๋ชจ๋ธ ํ๊ฐ ๊ฐ์ (= Reduction in Model Hallucination) : ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์๋ต์ ์์ฑํจ์ผ๋ก์จ, ๋ฐ์ดํฐ๋ก ๊ฐํ๋ LLM ์์ฉ ํ๋ก๊ทธ๋จ์ ์ฌ์ค์ ๊ทผ๊ฑฐํ ๋ฐ์์ ์ ๊ณตํ๋ฉฐ, ํ๊ฐ(hallucination) ๋ฐ์ ๊ฐ๋ฅ์ฑ์ ํฌ๊ฒ ์ค์ ๋๋ค.
ํฅ์๋ ์ ์ด ๊ฐ๋ฅ์ฑ๊ณผ ์ค๋ช ๊ฐ๋ฅ์ฑ (= Improved Controllability and Explainability) : ์ฌ์ฉ๋ ๋ฐ์ดํฐ๋ ๋ชจ๋ธ์ ์์ธก์ ๋ํ ์ฐธ์กฐ๋ก ํ์ฉ๋ ์ ์์ด, ์ ์ด ๊ฐ๋ฅ์ฑ๊ณผ ์ค๋ช ๊ฐ๋ฅ์ฑ์ ๋ชจ๋ ๊ฐํํฉ๋๋ค.
์ด๋ฌํ ๋ฐ์ ์ ๋ํ ๊ธฐ๋๊ฐ์๋ ๋ถ๊ตฌํ๊ณ , ๊ฐ๋ฐ์๋ค์ ๋์ ์ฑ๊ณต๋ฅ (์: ์ง์์๋ต์์์ ๋์ ์ ํ๋)์ ๋ฌ์ฑํ๊ธฐ ์ํด ๋ง์ ์ธ์ ์์์ ํฌ์ํด์ผ ํ๋ ์ด๋ ค์์ ์ง๋ฉดํ๊ณ ์์ต๋๋ค. ๋ค์ํ ์ฐ๊ตฌ์์๋ ๊ฒ์ ๊ธฐ๋ฐ ์์ฑ(RAG)์ด๋ ํ์ธํ๋๊ณผ ๊ฐ์ ๊ธฐ์ ์ ๊ธฐ๋ฐ์ผ๋ก ํ ๋ฐ์ดํฐ๋ก ๊ฐํ๋ LLM ์์ฉ ํ๋ก๊ทธ๋จ์ ๊ตฌ์ถํ๋ ๊ณผ์ ์์ ํนํ ๋ฒ๋ฅ , ์๋ฃ, ์ ์กฐ์ ๊ฐ์ ์ ๋ฌธ ๋ถ์ผ์์ ๋ฐ์ํ๋ ๋์ ๊ณผ ์ข์ ์ ๊ฐ์กฐํ๊ณ ์์ต๋๋ค.
์ด๋ฌํ ๋์ ๊ณผ์ ๋ ๋ฐ์ดํฐ ํ์ดํ๋ผ์ธ ๊ตฌ์ถ(์: ๋ฐ์ดํฐ ์ฒ๋ฆฌ ๋ฐ ์์ธ ์์ฑ)์์๋ถํฐ LLM์ ๋ฅ๋ ฅ์ ํ์ฉํ์ฌ ๋ณต์กํ ์ง๋ฅํ ์ถ๋ก ์ ์ํํ๋ ๋ฐ ์ด๋ฅด๊ธฐ๊น์ง ๊ด๋ฒ์ํ๊ฒ ๊ฑธ์ณ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, ๊ธ์ต ๋ถ์ผ ์์ฉ ํ๋ก๊ทธ๋จ์์๋ ๊ณ ์ฐจ์ ์๊ณ์ด ๋ฐ์ดํฐ๋ฅผ ์ดํดํ๊ณ ํ์ฉํด์ผ ํ๋ ๊ฒฝ์ฐ๊ฐ ์์ฃผ ๋ฐ์ํ๋ฉฐ, ์๋ฃ ๋ถ์ผ์์๋ ์๋ฃ ์ด๋ฏธ์ง๋ ์๊ณ์ด ์๋ฃ ๊ธฐ๋ก์ด ํ์์ ์ ๋๋ค. ์ด๋ฌํ ๋ค์ํ ํํ์ ๋ฐ์ดํฐ๋ฅผ LLM์ด ์ดํดํ ์ ์๋๋ก ํ๋ ๊ฒ์ ๋ฐ๋ณต์ ์ผ๋ก ๋ํ๋๋ ๊ณผ์ ์ ๋๋ค.
ํํธ, ๋ฒ๋ฅ ๋ฐ ์ํ ์์ฉ ๋ถ์ผ์์๋ LLM์ด ์๋ก ๋ค๋ฅธ ๊ตฌ์กฐ ๊ฐ์ ์ฅ๊ฑฐ๋ฆฌ ์์กด์ฑ์ ์ดํดํ๋ ๋ฐ ์ด๋ ค์์ ๊ฒช๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค. ๋ํ, ํน์ ์์ฉ ๋ถ์ผ์ ๋ฐ๋ผ LLM ์๋ต์ ํด์ ๊ฐ๋ฅ์ฑ๊ณผ ์ผ๊ด์ฑ์ ๋ํ ์๊ตฌ๊ฐ ์ฆ๊ฐํ๊ณ ์์ต๋๋ค. ๊ทธ๋ฌ๋ LLM์ ๋ณธ์ง์ ์ผ๋ก ๋ฎ์ ํด์ ๊ฐ๋ฅ์ฑ๊ณผ ๋์ ๋ถํ์ค์ฑ์ผ๋ก ํน์ง์ง์ด์ง๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ ์ด๋ฌํ ์๊ตฌ๋ฅผ ์ถฉ์กฑ์ํค๋ ๋ฐ ์ด๋ ค์์ด ๋ฐ๋ฆ ๋๋ค. ํนํ ์ ๋ฐ์ฑ๊ณผ ์ฑ ์์ด ์ค์ํ ๋ถ์ผ์์๋ LLM์ ํฌ๋ช ์ฑ์ ๋์ด๊ณ ๋ถํ์ค์ฑ์ ์ค์ด๋ ๊ฒ์ด ๊ฒฐ๊ณผ์ ๋ํ ์ ๋ขฐ์ฑ๊ณผ ์ ๋ขฐ๋ฅผ ๋์ด๋ ๋ฐ ๋งค์ฐ ์ค์ํฉ๋๋ค.
๋๋ฉ์ธ ์ ๋ฌธ๊ฐ์ ๊ฐ๋ฐ์๋ค๊ณผ์ ๊ด๋ฒ์ํ ๋ ผ์, ๊ทธ๋ฆฌ๊ณ ๊ทธ๋ค์ด ์ง๋ฉดํ ๋ฌธ์ ๋ค์ ๋ฉด๋ฐํ ๋ถ์ํ ๊ฒฐ๊ณผ, ๋ฐ์ดํฐ๋ก ๊ฐํ๋ LLM ์์ฉ ํ๋ก๊ทธ๋จ์ด ๋ง๋ฅ ํด๊ฒฐ์ฑ ์ด ์๋์ ๊น์ด ์ดํดํ๊ฒ ๋์์ต๋๋ค. ํนํ ์ ๋ฌธ ๋ถ์ผ์์๋ ํ์ค์ ์ธ ์๊ตฌ๊ฐ ๋งค์ฐ ๋ณต์กํ๋ฉฐ, ์ฃผ์ด์ง ๋ฐ์ดํฐ์์ ๊ด๊ณ๋ ํ์ํ ์ถ๋ก ์ ๋์ด๋์์ ํฌ๊ฒ ์ฐจ์ด๋ ์ ์์ต๋๋ค. ๊ทธ๋ฌ๋ ๊ฐ๋ฐ์๋ค์ ์ข ์ข ์ด๋ฌํ ์ฐจ์ด๋ฅผ ์ธ์ํ์ง ๋ชปํ ์ฑ, ์ฑ๋ฅ ์ ํ ๋ฌธ์ ๋ก ๊ฐ๋ ์ฐฌ ์๋ฃจ์ (๋น์ ํ์๋ฉด, ์ฌ๊ธฐ์ ๊ธฐ ๋ฌผ์ด ์๋ ์ง๊ณผ ๊ฐ์)์ ๋ง๋ค์ด๋ด๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค. ๋ฐ๋ฉด, ์๋ก ๋ค๋ฅธ ์์ค์ ์๊ตฌ์ ๊ทธ์ ๋ฐ๋ฅธ ๋ ํนํ ๋์ ๊ณผ์ ๋ฅผ ์ถฉ๋ถํ ์ดํดํ ์ ์๋ค๋ฉด, ๊ทธ์ ๋ง๊ฒ ์์ฉ ํ๋ก๊ทธ๋จ์ ๊ตฌ์ถํ๊ณ ๋จ๊ณ์ ์ผ๋ก ๊ฒฌ๊ณ ํ๊ณ ์ ๋ขฐํ ์ ์๋ ํ๋ก๊ทธ๋จ(๋ง์น ํ ๋จ๊ณ์ฉ ํผํผํ ์ง์ ์ง๋ ๊ฒ์ฒ๋ผ)์ ๋ง๋ค์ด๊ฐ ์ ์์ ๊ฒ์ ๋๋ค.
ํ์ง๋ง, ๊ธฐ์กด์ ์ฐ๊ตฌ์ ๊ด๋ จ๋ ์ค๋ฌธ ์กฐ์ฌ๋ ์ข ์ข ์ด๋ฌํ ์์ค ์ค ํ๋ ๋๋ ํน์ ๊ธฐ์ ์ฃผ์ ์๋ง ์ด์ ์ ๋ง์ถ๊ณ ์์ต๋๋ค. ์ด๋ฌํ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด, ์ฐ๋ฆฌ๋ ์ด ํฌ๊ด์ ์ธ ์ค๋ฌธ ์กฐ์ฌ๋ฅผ ์์ฑํ๊ฒ ๋์์ต๋๋ค. ์ด ์กฐ์ฌ๋ ์๋ก ๋ค๋ฅธ ์ฟผ๋ฆฌ ์์ค์ ๋ช ํํ ์ ์ํ๊ณ , ๊ฐ๊ฐ์ ์๋ฐ๋๋ ๊ณ ์ ํ ๋์ ๊ณผ์ ๋ฅผ ์๋ณํ๋ฉฐ (Figure 01), ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ๊ด๋ จ ์ฐ๊ตฌ์ ๋ ธ๋ ฅ์ ๋์ดํ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค. ์ด ์ค๋ฌธ ์กฐ์ฌ๋ ๋ ์๋ค์ด ๋ฐ์ดํฐ๋ก ๊ฐํ๋ LLM ์์ฉ ํ๋ก๊ทธ๋จ์ ๋ํ ์กฐ๊ฐ๋๋ฅผ ๊ฐ๋๋ก ๋๊ณ , ์ด๋ฌํ ์์ฉ ํ๋ก๊ทธ๋จ์ ์ฒด๊ณ์ ์ผ๋ก ๊ฐ๋ฐํ๋ ๋ฐฉ๋ฒ์ ๋ํ ์๋ด์ ์ญํ ์ ํ ๊ฒ์ ๋๋ค.
2. Problem Definition
๋ฐ์ดํฐ๋ก augmented๋ LLM application์ ๋๋ฉ์ธ๋ณ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ๋ ์ง๋ฌธ-์๋ต ๋ด์์๋ถํฐ ๋ณต์กํ ๋ฐ์ดํฐ ํ์ดํ๋ผ์ธ ๋ด์์์ ์๋ฏธ์ ์ฒ๋ฆฌ ์ฐ์ฐ์, ๋๋ ๋ค์ค ์์ด์ ํธ ์์คํ ์์ ํน์ ๋จ๊ณ๋ฅผ ์ฒ๋ฆฌํ๋ ์์ด์ ํธ์ ์ด๋ฅด๊ธฐ๊น์ง ๋ค์ํ ํํ๋ฅผ ์ทจํ ์ ์์ต๋๋ค. ๊ทธ๋ฌ๋ ์ผ๋ฐ์ ์ผ๋ก ๋ฐ์ดํฐ๋ก augmented๋ LLM application์ ๋ค์๊ณผ ๊ฐ์ ๊ณต์์ ๋ฐ๋ฅธ๋ค:
2.1 Stratification of Queries
๋ฐ์ดํฐ๋ก augmented๋ LLM application์ ๋งฅ๋ฝ์์, Query๋ ๋ณต์ก์ฑ๊ณผ ์๊ตฌ๋๋ ๋ฐ์ดํฐ ์ํธ์์ฉ์ ๊น์ด์ ๋ฐ๋ผ ๊ณ์ธตํ๋ ์ ์์ต๋๋ค. ์ด๋ฌํ ๊ณ์ธตํ๋ LLM์ด ์ ํํ๊ณ ๊ด๋ จ์ฑ ๋์ ์๋ต์ ์์ฑํ๊ธฐ ์ํด ์ํํด์ผ ํ๋ ๋ค์ํ ์์ค์ ์ธ์ง์ ์ฒ๋ฆฌ๋ฅผ ์ดํดํ๋ ๋ฐ ๋์์ ์ค๋๋ค. ๋จ์ํ ์ฌ์ค ๊ฒ์์์ ์์์ ์ง์์ ์ ๊ตํ ํด์์ ์ด๋ฅด๊ธฐ๊น์ง, ๊ฐ ๊ณ์ธต์ LLM์ด ์ฒ๋ฆฌํด์ผ ํ ๊ณผ์ ์ ์ ๊ตํจ์ด ํ ๋จ๊ณ์ฉ ๋์์ง๋ ๊ฒ์ ๋ํ๋ ๋๋ค. ์๋์์๋ ์ด๋ฌํ ๊ณ์ธต์ ๊ตฌ๋ถํ์ฌ ๊ฐ ๋จ๊ณ์์ ์๊ตฌ๋๋ ๊ณ ์ ํ ๋์ ๊ณผ์ ์ ํ์ ์ญ๋์ ๋ํ ํต์ฐฐ์ ์ ๊ณตํฉ๋๋ค.
Level 1 : Explicit Facts
์ด๋ฌํ ์ง๋ฌธ์ ์ฃผ์ด์ง ๋ฐ์ดํฐ์ ๋ช ์์ ์ผ๋ก ์กด์ฌํ๋ ์ฌ์ค์ ์ง์ ์ ์ผ๋ก ๋ฌป๋ ๊ฒ์ผ๋ก, ์ถ๊ฐ์ ์ธ ์ถ๋ก ์ด ํ์ํ์ง ์์ต๋๋ค. ์ด๋ ๊ฐ์ฅ ๊ฐ๋จํ ํํ์ ์ง๋ฌธ์ผ๋ก, ๋ชจ๋ธ์ ์ฃผ์ ๊ณผ์ ๋ ๊ด๋ จ ์ ๋ณด๋ฅผ ์ฐพ์ ์ถ์ถํ๋ ๊ฒ์ ๋๋ค. ์๋ฅผ ๋ค์ด, "2024๋ ํ๊ณ ์ฌ๋ฆผํฝ์ ์ด๋์์ ์ด๋ฆฌ๋์?"๋ผ๋ ์ง๋ฌธ์ ์ธ๋ถ ๋ฐ์ดํฐ์ ํฌํจ๋ ์ฌ์ค์ ๋ชฉํ๋ก ํฉ๋๋ค.
Level 2 : Implicit Facts
์ด๋ฌํ ์ง๋ฌธ์ ๋ฐ์ดํฐ์ ํฌํจ๋ ๋ช ์์ ์ด์ง ์์ ์ฌ์ค์ ๋ฌป๋ ๊ฒ์ผ๋ก, ์ฆ๊ฐ์ ์ผ๋ก ๋๋ฌ๋์ง ์์ผ๋ฉฐ ์ด๋ ์ ๋์ ์์์ ์ถ๋ก ์ด๋ ๊ธฐ๋ณธ์ ์ธ ๋ ผ๋ฆฌ์ ์ ์ถ๊ฐ ํ์ํ ์ ์์ต๋๋ค. ํ์ํ ์ ๋ณด๋ ์ฌ๋ฌ ๋ถ๋ถ์ ํฉ์ด์ ธ ์๊ฑฐ๋ ๊ฐ๋จํ ์ถ๋ก ๊ณผ์ ์ ๊ฑฐ์ณ์ผ ํ ์๋ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, "์บ๋ฒ๋ผ๊ฐ ์์นํ ๊ตญ๊ฐ์์ ํ์ฌ ๋ค์๋น์ ๋ฌด์์ธ๊ฐ์?"๋ผ๋ ์ง๋ฌธ์ ์บ๋ฒ๋ผ๊ฐ ํธ์ฃผ์ ์๋ค๋ ์ฌ์ค๊ณผ ํธ์ฃผ์ ํ์ฌ ๋ค์๋น์ ๋ํ ์ ๋ณด๋ฅผ ๊ฒฐํฉํ์ฌ ๋ตํ ์ ์์ต๋๋ค.
Level 3 : Interpretable Rationales
์ด๋ฌํ ์ง๋ฌธ์ ๋จ์ํ ์ฌ์ค์ ๋ด์ฉ์ ์ดํดํ๋ ๊ฒ์ ๋์ด, ๋ฐ์ดํฐ์ ๋งฅ๋ฝ์ ํตํฉ๋ ๋ถ์ผ๋ณ ๋ ผ๋ฆฌ๋ฅผ ์ดํดํ๊ณ ์ ์ฉํ๋ ๋ฅ๋ ฅ์ ์๊ตฌํฉ๋๋ค. ์ด๋ฌํ ๋ ผ๋ฆฌ๋ ์ธ๋ถ ์๋ฃ์ ๋ช ์์ ์ผ๋ก ์ ๊ณต๋๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ผ๋ฉฐ, ์ผ๋ฐ์ ์ธ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ ์ฌ์ ํ์ต ๋จ๊ณ์์๋ ํฌํจ๋์ง ์๊ฑฐ๋ ๋๋ฌผ๊ฒ ์ ํ๊ฒ ๋๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค. ์๋ฅผ ๋ค์ด, ์ ์ฝ ๋ถ์ผ์์๋ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ด FDA ๊ฐ์ด๋๋ผ์ธ(FDA Guidance) ๋ฌธ์๋ฅผ ํด์ํ์ฌ ํน์ ์ฝ๋ฌผ ์ ์ฒญ์ด ๊ท์ ์๊ตฌ์ฌํญ์ ์ค์ํ๋์ง ํ๊ฐํด์ผ ํ ์ ์์ต๋๋ค. ๋น์ทํ๊ฒ, ๊ณ ๊ฐ ์ง์ ์๋๋ฆฌ์ค์์๋ ์ฌ์ฉ์ ๋ฌธ์๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ฒ๋ฆฌํ๊ธฐ ์ํด ์ฌ์ ์ ์ ์๋ ์ํฌํ๋ก์ฐ์ ๋ณต์ก์ฑ์ ์ดํดํด์ผ ํฉ๋๋ค. ์๋ฃ ๋ถ์ผ์์๋ ๊ธ์ฑ ํํต ํ์ ๊ด๋ฆฌ๋ฅผ ์ํ ์ง์นจ๊ณผ ๊ฐ์ ํ์คํ๋ ์ง๋จ ๊ธฐ์ค์ ์ ๊ณตํ๋ ๋ง์ ์ง๋จ ๋งค๋ด์ผ์ด ์์ต๋๋ค. ์ด๋ฌํ ์ธ๋ถ ๋ ผ๋ฆฌ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ๋ฐ๋ฆ์ผ๋ก์จ ํํต ๊ด๋ฆฌ์ ๊ฐ์ ํน์ ๋ถ์ผ์ ์ ๋ฌธํ๋ ์ธ์ด ๋ชจ๋ธ ์ ๋ฌธ๊ฐ ์์คํ ์ ๊ฐ๋ฐํ ์ ์์ต๋๋ค. ์ด๋ ๊ณ ๊ฐ ์ง์ ๋ด๋น์์ ์ํธ์์ฉ์ ์๋ดํ๋ ์ ์ฐจ์ ๋จ๊ณ์ ์์ฌ ๊ฒฐ์ ํธ๋ฆฌ๋ฅผ ์ดํดํ์ฌ, ์๋ต์ด ์ ํํ ๋ฟ๋ง ์๋๋ผ ํ์ฌ์ ์๋น์ค ๊ธฐ์ค๊ณผ ํ๋กํ ์ฝ์ ์ค์ํ๋๋ก ๋ณด์ฅํ๋ ๊ฒ์ ํฌํจํฉ๋๋ค.
Level 4 : Hidden Rationales
์ด ๋ฒ์ฃผ์ ์ง๋ฌธ์ ๋ ์ด๋ ค์ด ์์ญ์ผ๋ก, ๋ ผ๋ฆฌ๊ฐ ๋ช ์์ ์ผ๋ก ๋ฌธ์ํ๋์ด ์์ง ์๊ณ , ์ธ๋ถ ๋ฐ์ดํฐ์์ ๊ด์ฐฐ๋ ํจํด๊ณผ ๊ฒฐ๊ณผ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ถ๋ก ํด์ผ ํ๋ ๊ฒฝ์ฐ๋ฅผ ๋ค๋ฃน๋๋ค. ์ฌ๊ธฐ์ ์จ๊ฒจ์ง ๋ ผ๋ฆฌ๋ ์๋ฌต์ ์ธ ์ถ๋ก ์ฒด๊ณ์ ๋ ผ๋ฆฌ์ ๊ด๊ณ๋ฟ๋ง ์๋๋ผ, ๊ฐ ์ง๋ฌธ์ ํ์ํ ์ธ๋ถ ๋ ผ๋ฆฌ๋ฅผ ์๋ณํ๊ณ ์ถ์ถํ๋ ๋ณธ์ง์ ์ผ๋ก ๊น๋ค๋กญ๊ณ ๋ณต์กํ ์์ ์ ํฌํจํฉ๋๋ค. ์๋ฅผ ๋ค์ด, IT ์ด์ ์๋๋ฆฌ์ค์์ ํด๋ผ์ฐ๋ ์ด์ ํ์ ๊ณผ๊ฑฐ์ ์ฌ๋ฌ ์ฌ๊ฑด์ ์ฒ๋ฆฌํ์ผ๋ฉฐ, ๊ฐ๊ฐ ๊ณ ์ ํ ์ํฉ๊ณผ ํด๊ฒฐ ๋ฐฉ๋ฒ์ ๊ฐ์ง๊ณ ์์ต๋๋ค. ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ ์ด๋ฌํ ํ๋ถํ ์๋ฌต์ ์ง์์ ์ ์ฅ์๋ฅผ ํ์ํ์ฌ ์ฑ๊ณต์ ์ธ ์ ๋ต๊ณผ ์์ฌ ๊ฒฐ์ ๊ณผ์ ์ ๋์ถํ ์ ์์ด์ผ ํฉ๋๋ค. ๋ง์ฐฌ๊ฐ์ง๋ก, ์ํํธ์จ์ด ๊ฐ๋ฐ์์๋ ์ด์ ๋ฒ๊ทธ์ ๋๋ฒ๊น ๊ธฐ๋ก์ด ํ๋ถํ ์๋ฌต์ ํต์ฐฐ์ ์ ๊ณตํ ์ ์์ต๋๋ค. ๊ฐ ๋๋ฒ๊น ๊ฒฐ์ ์ ๋จ๊ณ๋ณ ๋ ผ๋ฆฌ๊ฐ ์ฒด๊ณ์ ์ผ๋ก ๊ธฐ๋ก๋์ด ์์ง ์์ ์๋ ์์ง๋ง, LLM์ ํด๋น ๊ฒฐ์ ์ ์ด๋ ๊ธฐ๋ณธ ์์น์ ์ถ์ถํ ์ ์์ด์ผ ํฉ๋๋ค. ์ด๋ฌํ ์จ๊ฒจ์ง ๋ ผ๋ฆฌ๋ฅผ ์ข ํฉํจ์ผ๋ก์จ, LLM์ ์ ํํ ๋ฟ๋ง ์๋๋ผ, ์ค๋ ๊ฒฝํ์ ํตํด ์๋ จ๋ ์ ๋ฌธ๊ฐ๋ค์ด ๋ค๋ฌ์ด์จ ์๋ฌต์ ์ธ ์ ๋ฌธ์ฑ๊ณผ ๋ฌธ์ ํด๊ฒฐ ์ ๊ทผ ๋ฐฉ์์ ๋ฐ์ํ ์๋ต์ ์์ฑํ ์ ์์ต๋๋ค.
์์ฝํ์๋ฉด, ์ง๋ฌธ์ ์ฌ๋ฌ ์์ค์ผ๋ก ๋ถ๋ฅํ๋ ๊ฒ์ ๋ณต์ก์ฑ๊ณผ LLM(๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ)์ด ์๊ตฌํ๋ ์ดํด ์ ํ์ ์ ์ง์ ์ธ ๋จ๊ณ๋ฅผ ๋ฐ์ํฉ๋๋ค. Figure 01๊ณผ Figure 02์์ ์์๋ ๋ฐ์ ๊ฐ์ด, ์ฒซ ๋ฒ์งธ์ ๋ ๋ฒ์งธ ์์ค์ธ Explicit Facts์ Implicit Facts์ ๊ฐ๊ฐ ๋ช ์์ ์ผ๋ก ์ฃผ์ด์ง ์ ๋ณด์ด๋ , ๊ธฐ๋ณธ์ ์ธ ์ถ๋ก ์ด ํ์ํ ์ ๋ณด์ด๋ ์ฌ์ค์ ๋ฐ์ดํฐ๋ฅผ ๊ฒ์ํ๋ ๋ฐ ์ด์ ์ ๋ง์ถฅ๋๋ค. ์ด ๋ ์์ค์ LLM์ด ๋ฐ์ดํฐ๋ฅผ ์ถ์ถํ๊ณ ์ด๋ฅผ ์ผ๊ด๋ ์ฌ์ค๋ก ์ข ํฉํ๋ ๋ฅ๋ ฅ์ ์ํํฉ๋๋ค. ๋ฐ๋๋ก, Interpretable Rationales์ Hidden Rationales๋ก ์ด๋ฃจ์ด์ง ํ์ ๋ ์์ค์ ๋ฐ์ดํฐ๋ฅผ ๋ท๋ฐ์นจํ๋ ๋ ผ๋ฆฌ๋ฅผ ํ์ตํ๊ณ ์ ์ฉํ๋ LLM์ ๋ฅ๋ ฅ์ ์ด์ ์ ๋ง์ถฅ๋๋ค. ์ด๋ฌํ ์์ค์ ๊ฐ๊ฐ LLM์ด ์ ๋ฌธ๊ฐ์ ์ฌ๊ณ ๋ฐฉ์๊ณผ ์กฐ์จํ๊ฑฐ๋ ๋น๊ตฌ์กฐํ๋ ์ญ์ฌ์ ๋ฐ์ดํฐ์์ ์งํ๋ฅผ ์ถ์ถํด์ผ ํ๋ ๋ ๊น์ ์ธ์ง์ ์ฐธ์ฌ๋ฅผ ์๊ตฌํฉ๋๋ค.
์ด ๊ธฐ์ค์ ๋ฐ๋ผ ์ผ๋ฐ์ ์ธ ์ฌ์ค ๊ธฐ๋ฐ ์ง๋ฌธ ๋ฐ์ดํฐ์ ์ ๋ถ๋ฅํ ๊ฒฐ๊ณผ๋ Table 01์ ๋ํ๋ ์์ต๋๋ค. ๊ฐ ์์ค์ ๊ณ ์ ํ ๊ณผ์ ๋ฅผ ์ ์ํ๋ฉฐ, ํจ๊ณผ์ ์ผ๋ก ํด๊ฒฐํ๊ธฐ ์ํด ๋ง์ถคํ ์๋ฃจ์ ์ด ํ์ํฉ๋๋ค. ๋ค์ ์น์ ์์๋ ์ด๋ฌํ ์์ค์ ์ธ๋ถ ์ฌํญ์ ํ๊ตฌํ๋ฉฐ, LLM์ด ๋ค์ํ ์ ํ์ ์ง๋ฌธ์์ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ์ ํ๋ฆฌ์ผ์ด์ ์ ๋ณต์ก์ฑ์ ๊ทน๋ณตํ ์ ์๋๋ก ํ๋ ๊ตฌ์ฒด์ ์ธ ์ ๋ต๊ณผ ๋ฐฉ๋ฒ๋ก ์ ์ดํด๋ณผ ๊ฒ์ ๋๋ค. ์ด๋ฌํ ํ๊ตฌ๋ LLM์ ํ์ฌ ์ญ๋์ ๊ฐ์กฐํ๋ ๋์์, ์ด ๋ถ์ผ์์ ์งํ ์ค์ธ ๋ฐ์ ๊ณผ ๋ฏธ๋ ์ ์ฌ๋ ฅ์ ์กฐ๋ช ํ ๊ฒ์ ๋๋ค.
3. Explicit Fact Queries (L1)
3.1 Overview
Explicit Fact Query๋ data-augmented query ์ค ๊ฐ์ฅ ๋จ์ํ ์ ํ์ ํด๋นํฉ๋๋ค. ์ด ์์ค์ ์ง๋ฌธ์ ํด๋น ๋๋ฉ์ธ ๋ด์ ํน์ ๋ฌธ์๋ chunk์ ์ง์ ์ ๊ทผํ์ฌ ๋ต๋ณํ ์ ์์ต๋๋ค. ์ด๋ฌํ ์ง๋ฌธ์ ๋ต๋ณ์ ์ข ์ข ๋ฌธ์ ๋ด์ ๋ช ์์ ์ผ๋ก ๊ธฐ์ ๋ ํ๋ฒํ ํ ์คํธ ํํ๋ก ์ ๊ณต๋๋ฉฐ, ์๋ต ์์ฑ ๊ณผ์ ์์ ์ต์ํ์ ์ถ๋ก ์ด๋ ๊ฐ๋จํ ๋ ผ๋ฆฌ๋ง ์๊ตฌ๋ฉ๋๋ค.
์ด ์์ค์ ๊ฐ์ฅ ์ค์ํ ํน์ง์ ํน์ ์ธ๋ถ ๋ฐ์ดํฐ ์กฐ๊ฐ์ ๋ํด ๋ช ํํ๊ณ ์ง์ ์ ์ผ๋ก ์์กดํ๋ค๋ ์ ์ ๋๋ค.
3.1.1 Data Dependency
3.1.2 Definition
์ด ์ ์๋ explicit fact queries๊ฐ ๋ณต์กํ ์ถ๋ก ์ด๋ ์๋ณ๋ ๋ฐ์ดํฐ ์ธ๊ทธ๋จผํธ ๋ฒ์๋ฅผ ๋์ด์๋ ์ถ๊ฐ์ ์ธ ์ถ๋ก ์์ด, ์ง์ ์ ์ธ ๋ฐ์ดํฐ ๊ฒ์์ ์์กดํ๋ค๋ ์ ์ ๊ฐ์กฐํฉ๋๋ค. ๋ค์์ ์ด ์์ค์ ์ง๋ฌธ์ ํด๋นํ๋ ๋ช ๊ฐ์ง ์์ ๋๋ค:
What method was used in Paper X to solve problem Y? (Given a collection of academic papers)
Whatโs the AI strategy of company X? (Given a series of the latest news and articles about company X)
3.2 Challenge and Solutions
์ด ์์ค์ ์ง๋ฌธ์ ์ฃผ๋ก LLM์ด ์ ํํ ์๋ต์ ์ ๊ณตํ๊ธฐ ์ํด ์ฌ๋ฐ๋ฅธ ๋ฐ์ดํฐ๋ฅผ ๊ฒ์ํ๋ ๊ฒ์ด ํ์ํฉ๋๋ค. RAG๋ ํจ๊ณผ์ ์ด๊ณ ์ ์ฐํ๋ฉฐ ๋น๊ต์ ๋น์ฉ์ด ๋ฎ๊ธฐ ๋๋ฌธ์ ์ด ์์ค์ ์ง๋ฌธ์ ์ฒ๋ฆฌํ๋ ๋ฐ ๊ฐ์ฅ ๋๋ฆฌ ์ฑํ๋๋ ๊ธฐ์ ์๋ฃจ์ ์ ๋๋ค. ๊ทธ๋ฌ๋ RAG๋ฅผ ์ฌ์ฉํ๋๋ผ๋ ๊ฒฌ๊ณ ํ๊ณ ๊ณ ํ์ง์ ์์คํ ์ ๊ตฌ์ถํ๋ ๋ฐ๋ ์๋นํ ๋์ ๊ณผ์ ๊ฐ ์์ต๋๋ค. ์ด๋ฌํ ๊ณผ์ ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
๋ฐ์ดํฐ ์ฒ๋ฆฌ์ ์ด๋ ค์:
์ธ๋ถ ๋ฐ์ดํฐ๋ ์ข ์ข ๋งค์ฐ ๋น์ ํ์ ์ด๋ฉฐ, ํ, ์ด๋ฏธ์ง, ๋์์ ๋ฑ๊ณผ ๊ฐ์ ๋ค์ค ๋ชจ๋ ๊ตฌ์ฑ ์์๋ฅผ ํฌํจํ๊ณ ์์ต๋๋ค. ๋ํ ์ด๋ฌํ ๋ฐ์ดํฐ๋ฅผ ์ธ๊ทธ๋จผํธํํ๊ฑฐ๋ "์ฒญํน(chunking)"ํ๋ ๊ณผ์ ์์ ์๋์ ๋งฅ๋ฝ๊ณผ ์๋ฏธ๋ฅผ ์ ์งํ๋ ๋ฐ ์ด๋ ค์์ด ๋ฐ๋ฆ ๋๋ค.
๋ฐ์ดํฐ ๊ฒ์์ ์ด๋ ค์:
๋๊ท๋ชจ ๋น์ ํ ๋ฐ์ดํฐ์ ์์ ๊ด๋ จ ๋ฐ์ดํฐ ์ธ๊ทธ๋จผํธ๋ฅผ ๊ฒ์ํ๋ ์์ ์ ๊ณ์ฐ์ ์ผ๋ก ๋ถ๋ด์ด ํฌ๊ณ ์ค๋ฅ๊ฐ ๋ฐ์ํ๊ธฐ ์ฝ์ต๋๋ค. ํจ์จ์ ์ด๊ณ ์ ํํ ๊ฒ์ ๋ฉ์ปค๋์ฆ์ ๊ฐ๋ฐํ๋ ๊ฒ์ด ์ฃผ์ ๊ณผ์ ์ ๋๋ค.
ํ๊ฐ์ ์ด๋ ค์:
ํนํ RAG ์์คํ ์ ๊ตฌ์ฑ ์์ ์์ค์์ ์ฑ๋ฅ์ ํ๊ฐํ๋ ๊ฒ์ ๋ณต์กํ ์์ ์ ๋๋ค. ๋ฐ์ดํฐ ๊ฒ์๊ณผ ์๋ต ์์ฑ์ ํ์ง์ ์ ํํ ํ๊ฐํ ์ ์๋ ๊ฒฌ๊ณ ํ ํ๊ฐ ์งํ๋ฅผ ๊ฐ๋ฐํด์ผ ํฉ๋๋ค.
RAG์ ์ธ๊ธฐ๋ก ์ธํด ์ด๋ฌํ ๊ณผ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ๋ค์ํ ์ฐ๊ตฌ์ ๋๊ตฌ๋ค์ด ๊ฐ๋ฐ๋์์ต๋๋ค. ์ด ์น์ ์ ๋๋จธ์ง ๋ถ๋ถ์์๋ RAG๋ฅผ ๊ฐ์ ํ๊ธฐ ์ํ ๊ฐ์ฅ ์ค์ฉ์ ์ด๊ณ ์ํฅ๋ ฅ ์๋ ํฅ์ ๋ฐฉ์์ ์๊ฐํ ๊ฒ์ ๋๋ค. ๋ํ RAG๋ฅผ ๋์ด ์ฌ์ฉํ ์ ์๋ ๋์ฒด ๊ธฐ์ ์๋ฃจ์ ์ ๋ํด์๋ ๋ ผ์ํ ์์ ์ ๋๋ค.
3.3 Retrieval-augmented Generation (RAG)
Retrieval-Augmented Generation (RAG)์ ์ธ์ด ๋ชจ๋ธ์ด ์์ฑ ๊ณผ์ ์์ ์ธ๋ถ ์ ๋ณด๋ฅผ ๋์ ์ผ๋ก ๊ฒ์ํ์ฌ ์์ฐ์ด ์์ฑ ๋ฅ๋ ฅ์ ๋ณด๊ฐํ๋ ๋ฐฉ๋ฒ๋ก ์ ์๋ฏธํฉ๋๋ค. ์ด ๊ธฐ์ ์ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ ์์ฑ ๋ฅ๋ ฅ๊ณผ ๋ฐฉ๋ํ ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ ๋ฌธ์์์ ์ ๋ณด๋ฅผ ๊ฒ์ํ๋ ๊ธฐ๋ฅ์ ๊ฒฐํฉํฉ๋๋ค. ์ผ๋ฐ์ ์ผ๋ก ์ด ๊ณผ์ ์ ๋ฐ์ดํฐ ์ธ๋ฑ์ค ๊ตฌ์ถ, ๊ฒ์ ์์คํ ๊ตฌ์ฑ, ๊ทธ๋ฆฌ๊ณ ์๋ต ์์ฑ์ ๋จ๊ณ๋ฅผ ๊ฑฐ์ณ ๊ตฌํ๋ฉ๋๋ค.
3.3.1 Data Processing Enhancement
์ด ์์ค์์ Document Parsing์ ํ ์คํธ, ํ, ๋ํ ๋ฑ์์ ์ ๋ณด๋ฅผ ์ผ๊ด์ฑ ์๊ฒ ์ถ์ถํ๋ฉฐ, ๊ด๋ จ ์๋ ์ค๋ํซ์ ์ ํํ ์๋ณํ๊ณ ๊ฒ์ํ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค.
Multi-modal Document Parsing source document์ ํฌํจ๋ ์ฐจํธ, ํ, ๋๋ ๋์์(์: ํ์ ๋ นํ)๊ณผ ๊ฐ์ multi-modal content๋ฅผ ์ฒ๋ฆฌํ๋ ๊ฒ์ ๊ฐ์ฅ ์์ฃผ ์ ๊ธฐ๋๋ ์ง๋ฌธ ์ค ํ๋์ ๋๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ ๊ฐ์ง ์ ๊ทผ๋ฒ์ด ์ฃผ๋ก ์ฌ์ฉ๋ฉ๋๋ค. ์ฒซ๋ฒ์งธ approach๋ multi-modal content๋ฅผ textual-form์ผ๋ก ๋ณํํ๋ ๊ฒ์ ๋๋ค. ์๋ฅผ ๋ค์ด, Table-to-Text ๋ฐฉ๋ฒ์ ํ๋ฅผ ํ ์คํธ๋ก ๋ณํํ๋ฉฐ, ๋ค๋ฅธ ๊ธฐ์ ๋ค์ ์๊ฐ์ ์ฝํ ์ธ ๋ฅผ ํ ์คํธ ๋๋ ์์ฑ ๊ธฐ๋ฐ ์ค๋ช ์ผ๋ก ๋ณํํฉ๋๋ค. ์ด๋ ๊ฒ ๋ณํ๋ ๋ฐ์ดํฐ๋ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์์ ์ฒ๋ฆฌ๋ฉ๋๋ค. ๋๋ฒ์งธ approach๋ multi-modal embedding์ ํ์ฉํ์ฌ multi-modal data์์ ๊ฒ์๋ embedding์ ์ ๋ ฅ์ ์ํ soft prompt๋ก ์ฌ์ฉํ๋ค.
Chunking Optimization ๊ธด ํ ์คํธ์ ๊ฒฝ์ฐ ๋ฌธ์๋ฅผ ํ ์คํธ ์ฒญํฌ๋ก ๋ถํ ํ๋ ์์ ์ ์ผ๋ฐ์ ์ด๊ณ ํ์ํ ์์ ์ ๋๋ค. ํ ์คํธ chunk๊ฐ ํด์๋ก ์ปจํ ์คํธ์ ์๋ฏธ ์ผ๊ด์ฑ์ ๋ ๋ง์ด ๋ณด์กดํ ์ ์์ง๋ง, ๊ฐ chunk ๋ด์ ๋ ๋ง์ ๋ ธ์ด์ฆ๊ฐ ํฌํจ๋๋ ๊ฒฝํฅ์ด ์์ต๋๋ค. ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉ๋๋ Chunking Strategy์๋ fixed-size chunking, recursive chunking, sliding window chunking, paragraph-based chunking, semantic chunking ๋ฑ์ด ์์ต๋๋ค. ์ผ๋ถ ๋ฐฉ๋ฒ์ ์ง์๊ฐ ์๊ตฌํ๋ ์ธ๋ถ ์์ค์ ํ์ ํ ๋ค, ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๊ฒ์์ ์ ํฉํ detailํ ์์ค์ ํ ์คํธ chunk๋ฅผ ์ ํํ๋๋ก ์ค๊ณ๋์์ต๋๋ค. ๋ ๋ค๋ฅธ ๋ฐฉ๋ฒ์ ํ ์คํธ๋ฅผ ๋ ์์ ์ธ๊ทธ๋จผํธ๋ก ๋๋์ด ์ ๋ณด ์์ ์ฑ์ ๋์ ์์ค์ผ๋ก ์ ์งํ๋๋ก ์ฒ๋ฆฌํ๊ณ ์ ์ ํ๋ ๋ฐฉ์์ ์ฑํํฉ๋๋ค. ๋ํ ๋น์ ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ์๋ณธ ๋ฌธ์ ๊ตฌ์กฐ์ ๋ฐ๋ผ ํ ์คํธ๋ฅผ ๋ถํ ํ๋ ์ ๊ทผ ๋ฐฉ์๋ ์์ต๋๋ค.
3.3.2 Data Retrieval Enhancement
์ ๋ณด ๊ฒ์(IR) ๊ธฐ์ ์ RAG ์ ํ๋ฆฌ์ผ์ด์ ์ ์ํํ๊ฒ ์ ์ฉ๋ ์ ์์ต๋๋ค. ์ฃผ์ ๋จ๊ณ์๋ ๋ฐ์ดํฐ ์ธ๋ฑ์ค ์ค์ , ์ง์ ์ฒ๋ฆฌ, retrieving ๋ฐ matching, re-ranking, evaluation์ด ํฌํจ๋ฉ๋๋ค.
Indexing : ์ด ๋จ๊ณ์ ๋ชฉ์ ์ ๊ฒ์์ด์ ํ ์คํธ ์ธ๊ทธ๋จผํธ๋ฅผ ์ฐ๊ฒฐํ๋ ๋งคํ์ ์ค์ ํ๊ณ , ๊ฒ์ ์์คํ ์ด ์๋ํ๋ ๋ ผ๋ฆฌ๋ฅผ ๊ฒฐ์ ํ๋ ๊ฒ์ ๋๋ค. ์ธ๋ฑ์ฑ ๋ฐฉ๋ฒ์ ํฌ๊ฒ ์ธ ๊ฐ์ง๋ก ๋ถ๋ฅ๋ฉ๋๋ค: ํฌ์(sparse), ๋ฐ์ง(dense), ํผํฉ(hybrid) ๊ฒ์. ํฌ์ ๊ฒ์(Sparse Retrieval)๋ ํน์ ๋จ์ด๋ฅผ ์ฌ์ฉํ์ฌ ํ ์คํธ ์ธ๊ทธ๋จผํธ๋ฅผ ์ธ๋ฑ์ฑํฉ๋๋ค. ๋ฐ๋ฉด, ๋ฐ์ง ๊ฒ์(Dense Retrieval)์ ํ ์คํธ ์ธ๊ทธ๋จผํธ๋ฅผ ํน์ง์ ๋ฐ์ง ๋ฒกํฐ ๊ณต๊ฐ์ ๋งคํํฉ๋๋ค. ํผํฉ ๊ฒ์(Hybrid Retrieval)์ ํฌ์ ๊ฒ์๊ณผ ๋ฐ์ง ๊ฒ์์ ์์๋ฅผ ๊ฒฐํฉํ ๋ฐฉ์์ ๋๋ค.
ํฌ์ ๊ฒ์(Sparse Retrieval) : ์ด ๋ฐฉ์์ ๊ฐ๋จํ๊ณ ์ง๊ด์ ์ด๊ธฐ ๋๋ฌธ์ ์ฒ์์ผ๋ก ๋๋ฆฌ ์ฑํ๋ ์ธ๋ฑ์ฑ ๋ฐฉ๋ฒ์ ๋๋ค. TF-IDF์ BM25์ ๊ฐ์ ๊ธฐ์ ์ ๊ฐ ํ ์คํธ ์ธ๊ทธ๋จผํธ์ ์๋์ ์ธ ๋น๋๋ฅผ ๊ธฐ์ค์ผ๋ก ๊ฐ์ฅ ๋ํ์ ์ธ ํค์๋๋ฅผ ์๋ณํ๋๋ก ์ค๊ณ๋์์ต๋๋ค. ์ด๋ฌํ ๋ฐฉ๋ฒ์ ์ฌ์ ํ ๋ง์ RAG ํ๋ก์ ํธ์์ ๋๋ฆฌ ์ฌ์ฉ๋๊ณ ์์ต๋๋ค. ๊ทธ๋ฌ๋ ๋จ์ด ๋งค์นญ ๋ฐฉ์์ ๋์์ด๋ฅผ ์ธ์ํ์ง ๋ชปํ๊ธฐ ๋๋ฌธ์ ๊ฒ์ ์์ค์ด ๋ฐ์ํ ์ ์์ต๋๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด KNN๊ณผ ๊ฐ์ ๋ฐฉ๋ฒ์ ์ฌ์ฉํ์ฌ ํค์๋์ ์ ์ฌ์ฑ ๊ธฐ๋ฐ ๋งค์นญ์ ์ํํ ์ ์์ต๋๋ค. ๋๋ ํค์๋์ ๊ฐ์ ์ธ๋ฑ์ค๋ฅผ ๋ณ๊ฒฝํ์ฌ ํด๋น ํ ์คํธ ์ธ๊ทธ๋จผํธ์ ๋ํ ์ง์ ํ ํฐ์ ํ๋ฅ ์ ์์ธกํ๋ ๋ฐฉ์์ผ๋ก ์ ํํ ์๋ ์์ต๋๋ค.
๋ฐ์ง ๊ฒ์(Dense Retrieval) : ์ด ๋ฐฉ์์ ์ฃผ๋ก ์ฌ์ ํ์ต๋์๊ฑฐ๋ ์ธ๋ถํ๋ ํ ์คํธ ์ธ์ฝ๋๋ฅผ ์ฌ์ฉํ์ฌ ํ ์คํธ๋ฅผ ์ง์ ์๊ตฌ์ฌํญ์ ๋ง๋ ๋ฐ์ง ๋ฒกํฐ ๊ณต๊ฐ์ผ๋ก ๋งคํํ๋ ๊ฒ์ ํฌํจํฉ๋๋ค. BERT ๊ธฐ๋ฐ ์ธ์ฝ๋๋ ์ข ์ข DPR, ANCE, SimCSE, TAS-B์ ๊ฐ์ ๋ฐฉ๋ฒ์ ์ฌ์ฉํ์ฌ ๋น์ง๋ ๋ฐ์ดํฐ์์ ๋ฐ์ง ๊ฒ์๊ธฐ๋ก fine tuning ๋ฉ๋๋ค. ๋ ๋ค๋ฅธ ์ ๊ทผ๋ฒ์ผ๋ก๋ Contriever์ ๊ฐ์ unsupervised contrastive learning์ ํตํด fine tuning์ ์ํํ๋ ๋ฐฉ์์ด ์์ต๋๋ค. LLM๋ก๋ถํฐ ํผ๋๋ฐฑ์ ๋ฐ์ ๊ฒ์๊ธฐ์ ํ์ต ๋ชฉํ๋ฅผ ์๋ดํ๋ฉด ๊ฒ์๊ธฐ๊ฐ LLM์ ๋ ์ ํฉํ๋๋ก ํจ๊ณผ์ ์ผ๋ก ๊ฐ์ ํ ์ ์์ต๋๋ค. LLM์ ๊ฐ๋ ฅํ ๋ฅ๋ ฅ๊ณผ ํํ ๊ฐ๋ฅ์ฑ ๋๋ถ์ ์ต๊ทผ์๋ LLM ๊ธฐ๋ฐ ๋ฐ์ง ๊ฒ์์ด ์ฃผ์ ๊ด์ฌ ์์ญ์ผ๋ก ๋ ์ค๋ฅด๊ณ ์์ต๋๋ค. LLM2vec๋ ์ฌ์ ํ์ต๋ LLM์ ์ดํ ์ ๋ฉ์ปค๋์ฆ์ ์๋ฐฉํฅ์ผ๋ก ์์ ํ๊ณ , ๋ง์คํน๋ ๋ค์ ํ ํฐ ์์ธก ๋ฐฉ๋ฒ์ ์ฌ์ฉํ์ฌ ๋น์ง๋ ํ์ต์ ์ํํจ์ผ๋ก์จ LLM ๊ธฐ๋ฐ์ ๋ฐ์ง ๊ฒ์ ์๋ฒ ๋๋ฅผ ์์ฑํฉ๋๋ค. ๋ง์ฐฌ๊ฐ์ง๋ก, Llama2Vec๋ LLaMA ์ํคํ ์ฒ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ ๊ฐ์ง ์ฌ์ ์์ (์๋ฒ ๋ฉ ๊ธฐ๋ฐ ์๋ ์ธ์ฝ๋ฉ ๋ฐ ์๋ฒ ๋ฉ ๊ธฐ๋ฐ ์๋ ํ๊ท)์ ํ์ฉํ์ฌ ๋น์ง๋ ๋ฐ์ง ๊ฒ์ ์ธ์ฝ๋๋ฅผ ํ์ตํฉ๋๋ค. ์ด๋ฅผ ํตํด ๊ฒ์ ์์ ์ฑ๋ฅ์ด ํฌ๊ฒ ํฅ์๋์์ต๋๋ค.
๊ธฐํ(Others) : ํฌ์ ๊ฒ์๊ณผ ๋ฐ์ง ๊ฒ์์ ๊ฒฐํฉํ๋ ๊ฒ์ ํ ์คํธ ์ธ๊ทธ๋จผํธ์ ํต์ฌ ์ฃผ์ ์ ์ ๋ฐ์ ์ธ ํน์ง์ ๋์์ ์ง์คํ ์ ์๋ ํจ๊ณผ์ ์ธ ๋ฐฉ๋ฒ์ ๋๋ค. Feng ๋ฑ(2023)์ ์ง์์ ๋ต๋ณํ๊ธฐ ์ํด ํ์ํ ์ง์ ๋๋ฉ์ธ์ ๋จผ์ ๊ณ ์ ๋ ์ ๋ฌธ ์์ญ์ผ๋ก ๊ฒฐ์ ํ ๋ค์, ์ด ๋๋ฉ์ธ ๋ด์์ ๋ฐ์ง ๊ฒ์์ ์ฌ์ฉํด ๋ณด์กฐ ์ ๋ณด๋ฅผ ๊ฒ์ํ๋ ๋ฐฉ์์ ์ ์ํ์ต๋๋ค. ์ฌ๋ฌ ์ฐ๊ตฌ์์๋ ๋ฐ์ง ๋ฒกํฐ ์ธ๋ฑ์ฑ๊ณผ ํฌ์ ์ธ์ฝ๋ ์ธ๋ฑ์ฑ์ ๊ฒฐํฉํ์ฌ ํ ์คํธ ๋ธ๋ก์ ์๋ฏธ ์ ๋ณด๋ฅผ ๋ ์ ํฌ์ฐฉํ๊ณ , ๋ชฉํ ๋จ๋ฝ ๊ฒ์์ ์ ํ๋๋ฅผ ํฅ์์ํค๋ ๋ค์ํ ๋ฐฉ๋ฒ์ ํ๊ตฌํด ์์ต๋๋ค. ํํธ, Tang ๋ฑ(2024)์ LLM์ ์ธ๋ฑ์ฑ ๋ฐ ๊ฒ์ ๋ฅ๋ ฅ์ ๋ฏธ์ธ ์กฐ์ ํ์ฌ ์ด๋ฌํ ๊ธฐ๋ฅ์ LLM์ ์ง์ ํตํฉํ๋ ๋ฐฉ์์ ๊ฐ์ ํ์ต๋๋ค. ์ด๋ฅผ ํตํด LLM์ด ๊ฐ ์ง์์ ๋ํด ์์จ์ ์ผ๋ก ๋ฐ์ดํฐ ์ธ๋ฑ์ค์ ํ ์คํธ ์ธ๊ทธ๋จผํธ๋ฅผ ์์ฑํ ์ ์๋๋ก ํ์ต๋๋ค.
Query Document Alignment : ์ด ๋จ๊ณ์ ๋ชฉํ๋ ์ธ๋ถ ๋ฐ์ดํฐ์์ ์ง์์ ๋ฌธ์ ์ธ๊ทธ๋จผํธ๋ฅผ ์ผ์น์์ผ, ์ง์์ ๋ต๋ณํ๋ ๋ฐ ๊ฐ์ฅ ์ ํฉํ ๋ฌธ์ ์ธ๊ทธ๋จผํธ๋ฅผ ์๋ณํ๋ ๊ฒ์ ๋๋ค. Figure 03์์ ์ค๋ช ๋ ๊ฒ์ฒ๋ผ, ์ด๋ฌํ alignment์๋ ์ฃผ๋ก 3๊ฐ์ง ์ ๊ทผ ๋ฐฉ์์ด ์์ต๋๋ค: ์ ํต์ ์ ๋ ฌ(traditional alignment), ๋ฌธ์ ๋๋ฉ์ธ ์ ๋ ฌ(document domain alignment), ์ง์ ๋๋ฉ์ธ ์ ๋ ฌ(query domain alignment)์ ๋๋ค. ์ ํต์ ์ ๋ ฌ(Traditional Alignment)์ ๋ฌธ์ ์ธ๊ทธ๋จผํธ์ ์ง์๋ฅผ ๋์ผํ ์ธ์ฝ๋ฉ ๊ณต๊ฐ์ผ๋ก ๋งคํํ๋ ๋ฐฉ์์ ๋๋ค. ์๋ฅผ ๋ค์ด, ๋์ผ ์ธ์ฝ๋ ๊ธฐ๋ฐ์ ๋ง์ ๋ฐ์ง ๊ฒ์ ์ํคํ ์ฒ๋ ํนํ๋ ์ง์ ์ธ์ฝ๋๋ฅผ ์ฌ์ฉํ๋ ํน์ง์ด ์์ต๋๋ค. ๋ฐ๋๋ก, RAG์ ๊ฐ์ ์์คํ ์ด ํฌ์ ๊ฒ์์ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ, ๊ฒ์์ ์ํด ์ง์์์ ํค์๋๋ฅผ ์ถ์ถํด์ผ ํฉ๋๋ค. ๊ฒ์ ์ ํ๋๋ฅผ ๋์ฑ ๊ฐ์ ํ๊ธฐ ์ํด ์ง์ ์ฌ์์ฑ (query rewriting) ๊ธฐ์ ์ ํ์ฉํ ์ ์์ต๋๋ค. ์ด๋ ์ฌ์ฉ์ ์ฉ์ด์ ๋ถ์ ํ์ฑ์ด๋ ๋ชจํธํ ์ค๋ช ๊ณผ ๊ด๋ จ๋ ๋ฌธ์ ๋ฅผ ์ํํ์ฌ ๊ฒ์ ๊ฒฐ๊ณผ์ ์ ๋ฐ๋๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํฅ์์ํต๋๋ค. ๋ฌธ์ ๋๋ฉ์ธ ์ ๋ ฌ (Document Domain Alignment)์ ๋จผ์ ํฉ์ฑ ๋ต๋ณ(synthetic answer)์ ์์ฑํ ๋ค์, ์ด๋ฌํ ๋ต๋ณ์ ์ฌ์ฉํ์ฌ ๊ด๋ จ ๋ฐ์ดํฐ๋ฅผ ๊ฒ์ํ๋ ๋ฐฉ์์ ํฌํจํฉ๋๋ค. ์ด๋ฅผ ํตํด ์ง์์ ๊ฒ์๋ ๋ฐ์ดํฐ๊ฐ ๋์ผํ ๋ถํฌ ๊ณต๊ฐ์ ์์ง ์์ ๋ฌธ์ ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํด๊ฒฐํ ์ ์์ต๋๋ค. ์ด ๋ถ์ผ์์ ์ฃผ๋ชฉํ ๋งํ ์ฐ๊ตฌ๋ HyDE์ ๋๋ค. ์ง์ ๋๋ฉ์ธ ์ ๋ ฌ(Query Domain Alignment)์ ๊ฐ ํ ์คํธ์ ์์์ ๋จ์์ ๋ํด ํฉ์ฑ ์ง๋ฌธ ์ธํธ๋ฅผ ์์ฑํ๊ณ , ํ ์คํธ ์ธ๊ทธ๋จผํธ๋ฅผ ์ง์ ๊ณต๊ฐ์ผ๋ก ๋งคํํ ๋ค์, ์๋ ์ง์์ ๊ฐ์ฅ ๊ฐ๊น์ด ํฉ์ฑ ์ง๋ฌธ๊ณผ ํด๋น ํ ์คํธ ์ธ๊ทธ๋จผํธ๋ฅผ ๊ฒ์ํ๋ ๋ฐฉ์์ ๋๋ค. ์ด ๋ฐฉ๋ฒ์ ์ง์์ ๋ต๋ณํ๊ธฐ ์ํด ๊ฐ์ฅ ๊ด๋ จ ์๊ณ ๋งฅ๋ฝ์ ์ผ๋ก ์ ํฉํ ์ธ๊ทธ๋จผํธ๋ฅผ ์ ํํ ์ ์๋๋ก ๋ณด์ฅํฉ๋๋ค. SlimPLM์ ์๊ท๋ชจ ํ๋ก์ ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ํด๋ฆฌ์คํฑ ๋ต๋ณ์ ์์ฑํ๊ณ , ์ด๋ฅผ ํตํด ์ง๋ฌธ์ ๋ต๋ณํ๋ ๋ฐ ํ์ํ ์ง์์ ์์ธกํฉ๋๋ค. ์ด ์ ๊ทผ๋ฒ์ ์ง์๋ฅผ ๋ฌธ์ ๊ณต๊ฐ์ ์ ๋ ฌํ๋ ํจ๊ณผ์ ์ธ ๋ฐฉ๋ฒ์ ์ ๊ณตํฉ๋๋ค.
3.3.3 Response Generation Enhancement
์๋ต์ ์์ฑํ๋ ค๋ฉด ๊ฒ์๋ ์ ๋ณด๊ฐ ์ถฉ๋ถํ์ง, ์ถ๊ฐ์ ์ธ ์ธ๋ถ ๋ฐ์ดํฐ๊ฐ ํ์ํ์ง๋ฅผ ํ๋จํด์ผ ํฉ๋๋ค. ๋ํ, ๊ฒ์๋ ์ง์๊ณผ ๋ชจ๋ธ์ ๋ด์ฌ๋ ์ฌ์ ์ง์ ๊ฐ์ ์ถฉ๋์ ์ฒ๋ฆฌํ๋ ๊ฒ๋ ์ค์ํฉ๋๋ค. ์ง๋ ํ์ต ๊ธฐ๋ฐ ๋ฏธ์ธ ์กฐ์ (Supervised Fine-Tuning)์ RAG ์์คํ ์์ ์๋ต ์์ฑ ์ฑ๋ฅ์ ํฅ์์ํค๋ ํจ๊ณผ์ ์ธ ๋ฐฉ๋ฒ์ ๋๋ค.
๊ฒ์๋ ๋ฌธ๋งฅ์ด ๋ถ์ ์ ํ๊ฑฐ๋ ์๋ชป๋ ์ ๋ณด์ธ ๊ฒฝ์ฐ, ์ฌ์ ํ์ต๋ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ ์ฝ๊ฒ ์ค๋๋์ด ์๋ชป๋ ์๋ต์ ์์ฑํ ์ ์์ต๋๋ค. ๋ง์ ์ฐ๊ตฌ๋ RAG ์์คํ ์ ํ๋ จ ๋ฐ์ดํฐ๋ฅผ ์ ์คํ๊ฒ ์ค๊ณํจ์ผ๋ก์จ, ๋ฏธ์ธ ์กฐ์ ๋๋ ์ฌ์ ํ์ต์ ํตํด ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ํํ ์ ์์์ ๋ณด์ฌ์ฃผ์์ต๋๋ค.
RAAT๋ ์คํ์ ๋ถ์์ ํตํด, ๊ด๋ จ ์๋ ๊ฒ์ ๋ ธ์ด์ฆ, ๊ด๋ จ ์๋ ๊ฒ์ ๋ ธ์ด์ฆ, ๊ทธ๋ฆฌ๊ณ ๋ฐ์ฌ์ค์ (counterfactual) ๊ฒ์ ๋ ธ์ด์ฆ๊ฐ RAG ๋ชจ๋ธ์ ๋ฏธ์น๋ ๋ถ์ ์ ์ธ ํจ๊ณผ๊ฐ ์ ์ง์ ์ผ๋ก ์ฆ๊ฐํจ์ ์ ์ฆํ์ต๋๋ค. ์ด๋ฌํ ํ๋ จ ๊ณผ์ ์ ํตํฉํจ์ผ๋ก์จ, LLM์ ๋ด๋ถ์ ์ผ๋ก ๋ ธ์ด์ฆ๊ฐ ์๋ ๋ฌธ๋งฅ์ ์ธ์ํ ์ ์๊ฒ ๋์ด, ๋ ธ์ด์ฆ๊ฐ ์๋ ๊ฒ์ ์ํฉ์์๋ ์๋ต ์์ฑ ํ์ง์ด ํฌ๊ฒ ํฅ์๋ฉ๋๋ค. ๋ ๋์๊ฐ, RAG ์์คํ ๋ด์์ ๊ฒ์๊ธฐ(retriever)์ ์์ฑ๊ธฐ(generator) ๊ฐ์ ์ฑ๋ฅ ์ผ๊ด์ฑ์ ๋ณด์ฅํ๊ธฐ ์ํด, ์ผ๋ถ ์ฐ๊ตฌ์์๋ ํ์ต ๋จ๊ณ์์ ๊ฒ์๊ธฐ์ ์์ฑ๊ธฐ๋ฅผ ๊ณต๋์ผ๋ก ํ๋ จํ๋ ๋ฐฉ์์ ์ฑํํ๊ณ ์์ต๋๋ค.
4. Implicit Fact Queries (L2)
4.1 Overview
์ด๋ฌํ ์ง์๋ ์ฆ๊ฐ์ ์ผ๋ก ๋ช ํํ์ง ์์ ๋ฐ์ดํฐ ์์กด์ฑ์ ํฌํจํ๋ฉฐ, ์ผ์ ์์ค์ ์์์ ์ถ๋ก ์ด๋ ๊ธฐ๋ณธ์ ์ธ ๋ ผ๋ฆฌ์ ์ ์ถ๊ฐ ํ์ํ ์ ์์ต๋๋ค. ํ์ํ ์ ๋ณด๋ ์ฌ๋ฌ ์ธ๊ทธ๋จผํธ์ ๋ถ์ฐ๋์ด ์์ ์๋ ์๊ณ , ๊ฐ๋จํ ์ถ๋ก ์ ์๊ตฌํ ์๋ ์์ต๋๋ค. (์์๋ Figure 02 ์ฐธ์กฐ)
์ด ์์ค์ ์ง์๋ ์ปฌ๋ ์ ๋ด ์ฌ๋ฌ ๋ฌธ์์์ ์ ๋ณด๋ฅผ ์์งํ๊ณ ์ฒ๋ฆฌํ๋ ์์ ์ด ํ์ํฉ๋๋ค. ํ์ํ ์ ๋ณด์ ์์ด ๋จ์ผ ๊ฒ์ ์์ฒญ์ ๋ฒ์๋ฅผ ์ด๊ณผํ ์ ์์ด, ์๋ ์ง์๋ฅผ ์ฌ๋ฌ ๊ฒ์ ์์ ์ผ๋ก ๋ถํดํ๊ณ ๊ฒฐ๊ณผ๋ฅผ ์ข ํฉํ์ฌ ํฌ๊ด์ ์ธ ๋ต๋ณ์ ๊ตฌ์ฑํด์ผ ํ ์๋ ์์ต๋๋ค. ์ด ์์ค์ ๋๋ฉ์ธ๋ณ ์ ๋ฌธ ์ง์ ์์ด๋ ์์์ ์ถ๋ก ์ด ์์ฃผ ์๊ตฌ๋ฉ๋๋ค.
์คํ ๊ธฐ๋ก ๋ชจ์์ด ์ฃผ์ด์ก์ ๋, ์ํ ํฌ๊ธฐ๊ฐ 1000๊ฐ๋ฅผ ์ด๊ณผํ๋ ์คํ์ ๋ช ๊ฐ์ ๋๊น?
์๋ฃ ๊ธฐ๋ก ๋ชจ์์ด ์ฃผ์ด์ก์ ๋, ๊ฐ์ฅ ์์ฃผ ์ธ๊ธ๋ ์ฆ์ 3๊ฐ์ง๋ ๋ฌด์์ ๋๊น?
ํ์ฌ X์ ํ์ฌ Y์ AI ์ ๋ต์ ์ฐจ์ด์ ์ ๋ฌด์์ ๋๊น? (ํ์ฌ X์ Y์ ๋ํ ์ต์ ๋ด์ค์ ๊ธฐ์ฌ ๋ชจ์์ด ์ฃผ์ด์ง ๊ฒฝ์ฐ)
4.2 Challenges and Solutions
์ด ์์ค์ ์ง์๋ ์ฌ์ ํ ์ฌ์ค ๊ธฐ๋ฐ ์ง๋ฌธ์ ์ค์ฌ์ผ๋ก ์ด๋ฃจ์ด์ง์ง๋ง, ๋ต๋ณ์ด ๋จ์ผ ํ ์คํธ ๊ตฌ์ ์ ๋ช ์์ ์ผ๋ก ์ ์๋์ง ์์ต๋๋ค. ๋์ , ์ฌ๋ฌ ๊ฐ์ง ์ฌ์ค์ ๊ฒฐํฉํ๊ณ ์์์ ์ธ ์ถ๋ก ์ ํตํด ๊ฒฐ๋ก ์ ๋๋ฌํด์ผ ํฉ๋๋ค. ๋ ๋ฒจ 2 ์ง์์ ์ฃผ์ ๋์ ๊ณผ์ ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
Adaptive Retrieval Volumes : ์ง๋ฌธ์ ๋ฐ๋ผ ๊ฒ์ํด์ผ ํ๋ ๋ฌธ๋งฅ์ ์๊ฐ ๋ค๋ฅผ ์ ์์ผ๋ฉฐ, ๊ฒ์ํด์ผ ํ ๋ฌธ๋งฅ์ ์ ํํ ์๋ ์ง๋ฌธ๊ณผ ๋ฐ์ดํฐ์ ๋ชจ๋์ ๋ฐ๋ผ ๋ฌ๋ผ์ง ์ ์์ต๋๋ค. ๊ณ ์ ๋ ๊ฒ์ ํ์๋ฅผ ์ค์ ํ๋ฉด ์ ๋ณด ๊ณผ์(๋ ธ์ด์ฆ)์ด ๋ฐ์ํ๊ฑฐ๋ ์ ๋ณด๊ฐ ๋ถ์กฑํ ๊ฐ๋ฅ์ฑ์ด ์์ต๋๋ค.
Coordination between reasoning and retrieval : ์ถ๋ก ์ ๊ฒ์ํด์ผ ํ ์ ๋ณด์ ์ด์ ์ ์๋ดํ ์ ์์ผ๋ฉฐ, ๊ฒ์๋ ์ ๋ณด์์ ์ป์ ํต์ฐฐ์ ์ถ๋ก ์ ๋ต์ ๋ฐ๋ณต์ ์ผ๋ก ๊ฐ์ ํ ์ ์์ต๋๋ค. ์ด๋ฌํ ๋ณต์ก์ฑ์ ํด๊ฒฐํ๋ ค๋ฉด ์ธ๋ถ ๋ฐ์ดํฐ๋ฅผ ์ง๋ฅ์ ์ผ๋ก ํตํฉํ๊ณ ์ ๋ณ์ ์ผ๋ก ํ์ฉํ๋ฉฐ, LLM(๋ํ ์ธ์ด ๋ชจ๋ธ)์ ๋ด์ฌ๋ ์ถ๋ก ๋ฅ๋ ฅ์ ์ต๋ํ ํ์ฉํด์ผ ํฉ๋๋ค.
์ด ์์ค์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ๋ฐฉ๋ฒ์ผ๋ก๋ ๋ฐ๋ณต์ ์ธ RAG(์ถ๋ก ๊ณผ ๊ฒ์ ๊ฒฐํฉ), ๊ทธ๋ํ/ํธ๋ฆฌ ๊ธฐ๋ฐ RAG, SQL ๊ธฐ๋ฐ RAG ๋ฑ์ด ์์ต๋๋ค.
4.3 Iterative RAG
์์์ ์ฌ์ค ์ง์๋ Multi-Hop RAG(์ถ๋ก ๊ณผ ๊ฒ์ ๊ฒฐํฉ) ์์ ๊ณผ ์ ์ฌํฉ๋๋ค. ์ด ๋ฐฉ๋ฒ ์นดํ ๊ณ ๋ฆฌ๋ ๋ค๋จ๊ณ RAG ํ๋ก์ธ์ค๋ฅผ ๋์ ์ผ๋ก ์ ์ดํ๋ฉฐ, ์ฌ๋ฐ๋ฅธ ๋ต๋ณ์ ๋๋ฌํ ๋๊น์ง ๋ฐ๋ณต์ ์ผ๋ก ์ ๋ณด๋ฅผ ์์งํ๊ฑฐ๋ ์์ ํฉ๋๋ค.
Planning-based : ๊ฒ์ ์ด์ ๋จ๊ณ์์ ๋จ๊ณ๋ณ ๊ฒ์ ๊ณํ์ ์์ฑํ๊ฑฐ๋, ๊ฒ์ ๊ณผ์ ์ค ๋์ ์ผ๋ก ๊ณํ์ ์์ฑํ์ฌ ๊ฐ ๊ฒ์์ ์ด์ ์ ์ธ๋ถํํ๊ณ , ๋ฐ๋ณต์ ์ธ RAG ์์คํ ์ ํจ์จ์ ์ผ๋ก ์๋ดํ ์ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, ReAct [93]๋ ๊ฐ ๋จ๊ณ์ ๋ชฉํ๋ฅผ ์ ์ง์ ์ผ๋ก ์ ๋ฐ์ดํธํ์ฌ ์ง๋ฌธ์ ๋ตํ๊ธฐ ์ํด ํ์ํ ์ง์ ๊ฒฉ์ฐจ๋ฅผ ์ค์ ๋๋ค. IRCoT [94]์ RAT [95]๋ ์ฐ์์ ์ฌ๊ณ (Chain of Thought)๋ฅผ ํ์ฉํด RAG ํ์ดํ๋ผ์ธ์ ์๋ดํ๋ฉฐ, ์ด์ ์ ํ์ํ ์ ๋ณด์ ๊ธฐ๋ฐํด ํ์ฌ ๊ฒ์ ๋ชฉํ๋ฅผ ๊ฒฐ์ ํฉ๋๋ค. GenGround [96]์ LLM(๋ํ ์ธ์ด ๋ชจ๋ธ)์ด ์ต์ข ๋ต๋ณ์ ๋๋ฌํ ๋๊น์ง ๋ ๋จ๊ณ๋ฅผ ๋ฐ๋ณตํ๋๋ก ํฉ๋๋ค: (1) ๋ ๋จ์ํ ๋จ์ผ ๋จ๊ณ ์ง๋ฌธ์ ์์ฑํ๊ณ ์ง์ ์ ์ธ ๋ต๋ณ์ ์์ฑํ๋ ๋จ๊ณ, (2) ์ง๋ฌธ-๋ต๋ณ ์์ ๊ฒ์๋ ๋ฌธ์๋ก ๋ค์ ์ถ์ ํ์ฌ ์์ธก์ ๋ถ์ ํ์ฑ์ ํ์ธํ๊ณ ์์ ํ๋ ๋จ๊ณ. ์ด๋ฌํ ๋ฐ๋ณต์ ์ธ ํ๋ก์ธ์ค๋ ๋ ์ ๋ขฐํ ์ ์๊ณ ์ ํํ ์๋ต์ ๋ณด์ฅํฉ๋๋ค.
Information Gap Filling Based : ITRG [97]์ ๋ฐ๋ณต์ ์ธ ๊ฒ์-์์ฑ ํ๋ ฅ ํ๋ ์์ํฌ๋ฅผ ๋์ ํ์ฌ, ๊ธฐ์กด ์ง์์ ๋ฐํ์ผ๋ก ๋ต๋ณ์ ์์ฑํ ๋ค, ์ดํ ๋ผ์ด๋์์ ์๋ต์ ์๋ ค์ง์ง ์์ ๋ถ๋ถ์ ๊ฒ์ ๋ฐ ์์ฑํ์ฌ ๋ณด์ํฉ๋๋ค. ๋น์ทํ๊ฒ, FLARE [50]๋ ๊ฐ ๋ฐ๋ณต ๋จ๊ณ์์ ์์ฑ๋ ๋ต๋ณ์ ๋ฎ์ ํ๋ฅ ์ ํ ํฐ์ ์์ ํ๋ฉฐ ๊ฐ์ ํฉ๋๋ค. ๋ฐ๋ฉด, Self-RAG [92]๋ ๋ํ ๋ชจ๋ธ์ ๋ฏธ์ธ ์กฐ์ ํ์ฌ ์ธ์ ๊ฒ์์ ์ค๋จํ๊ณ ์ง๋ฌธ์ ๋ต๋ณ์ ์์ํ ์ง ์์จ์ ์ผ๋ก ๊ฒฐ์ ํ ์ ์๋๋ก ํฉ๋๋ค.
4.4 Graph / Tree Question Answering
์์์ ์ฌ์ค ์ง์๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด์๋ ์ฌ๋ฌ ์ฐธ์กฐ ์๋ฃ์์ ์ ๋ณด๋ฅผ ์ข ํฉํ๋ ์์ ์ด ํ์ํฉ๋๋ค. ๊ทธ๋ํ๋ ํธ๋ฆฌ ๊ตฌ์กฐ๋ ์ง์ ๊ธฐ๋ฐ์ด๋ ๋ฐ์ดํฐ ๊ธฐ๋ฐ์ด๋ ๊ฐ์ ํ ์คํธ ๊ฐ์ ๊ด๊ณ ๊ตฌ์กฐ๋ฅผ ์์ฐ์ค๋ฝ๊ฒ ํํํ ์ ์์ด, ์ด๋ฌํ ์ ํ์ ๋ฐ์ดํฐ ๊ฒ์ ๋ฌธ์ ์ ๋งค์ฐ ์ ํฉํฉ๋๋ค.
Traditional Knowledge Graph : ๋ํ ์ธ์ด ๋ชจ๋ธ(LLM)์ ํจ์จ์ฑ์ ํฅ์์ํค๊ธฐ ์ํด ๊ณ ๋ ค๋ ์ด๊ธฐ ๊ตฌ์กฐ ์ค ํ๋๋ ์ ํต์ ์ธ ์ง์ ๊ทธ๋ํ์ ๋๋ค. ์ด ๊ทธ๋ํ์์ ๊ฐ ๋ ธ๋๋ ๊ฐ์ฒด(entity)๋ฅผ ๋ํ๋ด๊ณ , ๋ ธ๋ ๊ฐ์ ์ฐ๊ฒฐ(์ฃ์ง)์ ๊ฐ์ฒด๋ค ๊ฐ์ ๊ด๊ณ๋ฅผ ๋ํ๋ ๋๋ค. [98]์ LLM๊ณผ ์ง์ ๊ทธ๋ํ(KG)์ ๋ฐ์ ์ ์ํ ๋ค์๊ณผ ๊ฐ์ ๋ฏธ๋์งํฅ์ ์ธ ๋ก๋๋งต์ ์ ์ํ์ต๋๋ค : KG-enhanced LLMs: LLM์ ์ฌ์ ํ์ต(pre-training) ๋ฐ ์ถ๋ก (inference) ๋จ๊ณ์์ KG๋ฅผ ํตํฉํ์ฌ ๋ชจ๋ธ์ ์ง์ ์ดํด๋ฅผ ์ฌํ, LLM-enhanced KGs: KG ์๋ฒ ๋ฉ, ์์ฑ(completion), ๊ตฌ์ถ(construction), ๊ทธ๋ํ-ํ ์คํธ ์์ฑ, ์ง๋ฌธ ์๋ต ๋ฑ ๋ค์ํ KG ์์ ์ LLM์ ํ์ฉ, Collaborative LLM+KG ์ ๊ทผ๋ฒ: LLM๊ณผ KG๊ฐ ์ํธ ๋ณด์์ ์ธ ์ญํ ์ ํ์ฌ ๋ฐ์ดํฐ์ ์ง์์ ๊ธฐ๋ฐํ ์๋ฐฉํฅ ์ถ๋ก ์ผ๋ก ์๋ก๋ฅผ ๊ฐํ.
Rigel-KQGA ๋ชจ๋ธ [99]์ ์ง์์ ๊ธฐ๋ฐํ์ฌ ํ์ํ ์ง์ ๊ทธ๋ํ ๋ ธ๋๋ฅผ ์์ธกํ๊ณ ์ด๋ฅผ LLM๊ณผ ๊ฒฐํฉํด ๋ต๋ณ์ ๋์ถํ๋ ์๋ ํฌ ์๋ KGQA ๋ชจ๋ธ์ ๋๋ค. Think-on-Graph [100] ๋ฐ KnowledgeNavigator [101]์ ๊ฐ์ ์ฐ๊ตฌ๋ ์ง์์ ๊ด๋ จ๋ ๊ฐ์ฒด๋ฅผ ์ถ์ถํ ํ, ๊ทธ๋ํ์์ ๋ฐ๋ณต์ ์ธ BFS ๊ฒ์์ ์ํํ๋ฉฐ LLM์ ์ฌ๊ณ ๊ธฐ๊ณ๋ก ํ์ฉํ์ฌ ์ต์ ์ ํ์ ๊ฒฝ๋ก๋ฅผ ๊ฒฐ์ ํ๊ณ ๊ฐ์ง์น๊ธฐ๋ฅผ ์ํํฉ๋๋ค. R3 [102]๋ LLM์ ํตํด ์ง์์ ๋์ํ ์ ์๋ ์ฌ๋ฌ ์์์ ๊ณต๋ฆฌ๋ฅผ ๋์ ํ๊ณ , ์ฐ๊ด๋ ์ง์ ํ์ ๊ทธ๋ํ๋ฅผ ์์ฐจ์ ์ผ๋ก ๊ฒ์ํ์ฌ ํ์ฌ ์ ๋ณด๋ก ์ง์๋ฅผ ํด๊ฒฐํ ์ ์๋์ง ํ๊ฐํ๋ฉฐ, ํด๊ฒฐ๋ ๋๊น์ง ๊ณ์ํฉ๋๋ค.
Data Chunk Graph / Tree : LLM์ ๋ฐ์ด๋ ๋ ํด ๋ฅ๋ ฅ์ ํ ์คํธ๋ฅผ ๊ฐ์ฅ ์ธ๋ถ์ ์ธ ์์ค์ผ๋ก ๋๋์ง ์๊ณ ๋ ํจ๊ณผ์ ์ผ๋ก ์ดํดํ ์ ์๊ฒ ํฉ๋๋ค. ์ด์ ๊ด๋ จํ์ฌ ์ฐ๊ตฌ์๋ค์ ํ ์คํธ ์ฒญํฌ๋ ๋ฐ์ดํฐ ์ฒญํฌ๋ฅผ ๊ทธ๋ํ๋ ํธ๋ฆฌ์ ๋ ธ๋๋ก ์ฌ์ฉํ๊ณ , ์ฃ์ง๋ฅผ ํตํด ๊ณ ์์ค ๋๋ ์ ๊ตํ๊ฒ ์ค๊ณ๋ ๊ด๊ณ๋ฅผ ํํํ๋ ์คํ์ ์์ํ์ต๋๋ค. Knowledge-Graph-Prompting [103]์ ์์์ ์ฌ์ค์ ํ๊ตฌํด์ผ ํ๋ ์ธ ๊ฐ์ง ์ ํ์ ์ง๋ฌธ์ ๋ ผ์ํฉ๋๋ค:
Bridging Questions : ์์ฐจ์ ์ถ๋ก ์ ์์กด.
Comparing Questions : ๋ค๋ฅธ ๊ตฌ์ ๊ฐ์ ๋ณ๋ ฌ์ ์ถ๋ก ์ ์์กด.
Structural Questions : ๋ฌธ์ ๊ตฌ์กฐ์ ๋์ํ๋ ๋ด์ฉ์ ๊ฐ์ ธ์ค๋ ๋ฐ ์์กด.
์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด Knowledge-Graph-Prompting์ ๊ฐ์ฒด ์ธ์, TF-IDF, KNN, ๋ฌธ์ ๊ตฌ์กฐ ๊ณ์ธต์ ํ์ฉํ์ฌ ๋ฌธ์ ๊ทธ๋ํ๋ฅผ ๊ตฌ์ฑํ๊ณ , ์ง๋ฌธ์ ๋ตํ๊ธฐ ์ํ ํ์ ๊ทธ๋ํ๋ฅผ ์ถ์ถํฉ๋๋ค. MoGG [44]๋ ํ๋ ๋๋ ๋ ๋ฌธ์ฅ์ ๊ฐ์ฅ ์์ ์๋ฏธ ๋จ์๋ก ๊ฐ์ฃผํ๋ฉฐ ์ด๋ฅผ ๋ ธ๋๋ก ์ฌ์ฉํ๊ณ , ๋ ธ๋ ๊ฐ์ ์๋ฏธ์ ์ ์ฌ์ฑ์ ๊ธฐ๋ฐ์ผ๋ก ์ฃ์ง๋ฅผ ๊ตฌ์ถํฉ๋๋ค. ๋ํ, ์์ธก๊ธฐ๋ฅผ ํ๋ จ์์ผ ์ง๋ฌธ์ ๋ตํ๊ธฐ ์ํด ํ์ํ ํ ์คํธ์ ์ธ๋ถํ ์ ๋์ ํ์ํ ํ์ ๊ทธ๋ํ์ ํฌ๊ธฐ๋ฅผ ๊ฒฐ์ ํฉ๋๋ค. RAPTOR [43]๋ ํ ์คํธ ๋ธ๋ก ๊ฐ์ ์์ ์๋ฏธ ๊ด๊ณ๋ฅผ ํฌ์ฐฉํ๊ธฐ ์ํด ํด๋ฌ์คํฐ๋ง ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ์ฌ ๊ฐ์ฅ ์ธ๋ถํ๋ ํ ์คํธ ๋ธ๋ก์ ๊ณ์ธต์ ์ผ๋ก ํด๋ฌ์คํฐ๋งํฉ๋๋ค. ๊ฐ ๊ณ์ธต ์์ค์์ ์๋ก์ด ์๋ฏธ ์ ๋ณด๋ฅผ ์์ฝํ๊ณ , ๋ ธ๋๊ฐ ์ถ์๋ ํธ๋ฆฌ ๋ด์์ ๊ฐ์ฅ ํ์ํ ์ ๋ณด๋ฅผ ํธ์ถํฉ๋๋ค. ์ด์ ์ ์ฌํ๊ฒ, GraphRAG [104]๋ ํด๋ฌ์คํฐ๋ง ์ ๊ทผ ๋ฐฉ์์ ์ฑํํฉ๋๋ค. ์ด๊ธฐ์๋ ๊ฐ์ฅ ์์ ํ ์คํธ ๋ธ๋ก์ ์๋ฏธ์ ์ ์ฌ์ฑ์ ๊ธฐ๋ฐ์ผ๋ก ์ฐ๊ฒฐํ๊ณ , ์ดํ ์ปค๋ฎค๋ํฐ ํ์ง ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ์ฌ ๋ ธ๋๋ฅผ ๊ทธ๋ฃนํ ํฉ๋๋ค. ๋ง์ง๋ง์ผ๋ก, ๊ฐ ๋ ธ๋ ์ปค๋ฎค๋ํฐ ๋ด์ ์๋ต์ ๋ถ์ํ์ฌ ์ง๋ฌธ์ ๋ํ ๊ธ๋ก๋ฒ ๋ต๋ณ์ ์์ฝํฉ๋๋ค.
4.5 Natural Language to SQL Queries
๊ตฌ์กฐํ๋ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ ๋, ์์ฐ์ด ์ง์๋ฅผ SQL๋ก ๋ณํ(NL2SQL)ํ๋ ๊ฒ์ ํจ๊ณผ์ ์ธ ์ ๊ทผ ๋ฐฉ์์ด ๋ ์ ์์ต๋๋ค. Chat2DB์ ๊ฐ์ ๋๊ตฌ๋ ์ฌ์ฉ์ ์ง์๋ฅผ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์ง์๋ก ๋ณํํ์ฌ ์ด ๊ณผ์ ์ ์ฉ์ดํ๊ฒ ํฉ๋๋ค. ๋ํ ์ธ์ด ๋ชจ๋ธ(LLM)์ ์๋์ ๋ค์ด์, ํ ์คํธ๋ฅผ SQL๋ก ๋ณํํ๋ ๊ธฐ์ (text-to-SQL)[105, 106, 107, 108]์ด ํฌ๊ฒ ๋ฐ์ ํ๋ฉด์, ์ด๋ฌํ ๋๊ตฌ๋ฅผ ํ์ฉํด ๊ตฌ์กฐํ๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค์์ ์ ๋ณด๋ฅผ ๊ฒ์ํ ์ ์๊ฒ ๋์์ต๋๋ค.
์ด ๊ธฐ๋ฅ์ LLM์ ์์ฑ ๋ฅ๋ ฅ์ ๊ฐํํ๊ธฐ ์ํ ๊ฐ์น ์๋ ์ธ๋ถ ๋ฐ์ดํฐ ์์ค๋ก ์์ฉํฉ๋๋ค. Text-to-SQL ๋๊ตฌ๋ฅผ [109] ํตํฉํจ์ผ๋ก์จ, LLM์ ๊ตฌ์กฐํ๋ ๋ฐ์ดํฐ์ ์ ๊ทผํ๊ณ ์ด๋ฅผ ํตํฉํ์ฌ ๋ณด๋ค ์ ํํ๊ณ ๋งฅ๋ฝ์ ์ผ๋ก ์ ํฉํ ์๋ต์ ์์ฑํ ์ ์์ต๋๋ค. ์ด๋ฌํ ํตํฉ์ ์์ฑ ์ฝํ ์ธ ์ ๊น์ด์ ํ์ง์ ํฅ์์ํฌ ๋ฟ๋ง ์๋๋ผ LLM์ ํ์ฉ ๋ฒ์๋ฅผ ํ์ฅํ์ฌ, ๋ฐ์ดํฐ๋ฒ ์ด์ค ์ฝํ ์ธ ์์ ์ํธ์์ฉ ๋ฐ ํด์์ด ํ์ํ ๋ณด๋ค ๋ณต์กํ ์์ ์ ์ํํ ์ ์๋๋ก ํฉ๋๋ค.
4.6 Discussion on Fact Queries
Whether to Use-Finetuing (ํ์ธํ๋์ ์ฌ์ฉํ ์ง์ ๋ํ ์ฌ๋ถ)
์ผ๋ถ ์ฐ๊ตฌ [110]๋ LLM(๋ํ ์ธ์ด ๋ชจ๋ธ)์ด ํ์ธํ๋์ ํตํด ์๋ก์ด ์ฌ์ค์ ์ง์์ ์ต๋ํ๋ ๋ฐ ์ด๋ ค์์ ๊ฒช๋๋ค๋ ์ ์ ๋ณด์ฌ์ค๋๋ค. ์ด ๊ณผ์ ์ LLM์ ์ ๋ฐ์ ์ธ ์ฑ๋ฅ ์ ํ๋ฅผ ์ด๋ํ์ฌ ์ ํํ ์๋ต ์์ฑ ๋ฅ๋ ฅ์ ์ฝํ์ํค๊ณ , ํ๊ฐ(hallucination)์ด ๋ ๋ง์ด ๋ฐ์ํ๋ ๊ฒฐ๊ณผ๋ฅผ ๋ณ์ ์ ์์ต๋๋ค. ๋ํ ์ฐ๊ตฌ [111]์ ๋ฐ๋ฅด๋ฉด, ์๋ก์ด ์ฌ์ค์ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์ฌ LLM์ ํ์ธํ๋ํ๋ฉด ๋ชจ๋ธ์ด ์ฌ์ค ์ง์ ์ ๊ธฐ๊ณ์ ์ผ๋ก ์๊ธฐํ ๊ฐ๋ฅ์ฑ์ด ์์ต๋๋ค. ํฅ๋ฏธ๋กญ๊ฒ๋, ์ด๋ฌํ ์๊ธฐ๋ ์ฌ์ค์ ํํ ๋ฐฉ์์ ๋ณ๊ฒฝํ๋ฉด ์ต๊ทผ ํ์ต๋ ์ง์์ด ํจ๊ณผ๋ฅผ ์์ ์ ์์ผ๋ฉฐ, ์ด๋ LLM์ด ํ๋ฉด์ ์ธ ์์ค์ ์ดํด์ ๊ธฐ์ต๋ง์ ์ ์งํ๊ณ ์์์ ๋ํ๋ ๋๋ค. ์ด๋ฌํ ๊ฒฐ๊ณผ๋ ํ์ฌ์ ํ์ธํ๋ ํ๋ก์ธ์ค๊ฐ ๊ฐ์ง ํ๊ณ๋ฅผ ๋ณด์ฌ์ฃผ๋ฉฐ, ์๋ก์ด ์ ๋ณด๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํตํฉํ๊ณ ์ ์์ํค๊ธฐ ์ํ ๋ณด๋ค ์ ๊ตํ ๋ฐฉ๋ฒ์ด ํ์ํ๋ค๋ ๊ฒ์ ์์ฌํฉ๋๋ค.
Wheter to Seperate Different Levels of Fact Queries (์ฌ์ค ์ง์์ ์์ค์ ๊ตฌ๋ถํ ํ์์ฑ)
๋ช ์์ ์ฌ์ค ์ง์ (Explicit Fact Query)์ ์์์ ์ฌ์ค ์ง์ (Implicit Fact Query)๋ ๋ชจ๋ ์ฌ์ค ๊ธฐ๋ฐ ์ง์์ ์ํ์ง๋ง, ๋ฐ์ดํฐ ์ฆ๊ฐ ๊ธฐ๋ฐ LLM ์ ํ๋ฆฌ์ผ์ด์ ์ ๊ตฌ์ถํ๊ธฐ ์ ์ ์ด ์ง์๋ค์ด ์ด๋ค ์์ค์ ์ํ๋์ง ํ๋จํ๋ ๊ฒ์ด ๋งค์ฐ ์ค์ํฉ๋๋ค. ๋ช ์์ ์ฌ์ค ์ง์๋ฅผ ์์์ ์ฌ์ค ์ง์๋ก ์๋ชป ๋ถ๋ฅํ๋ฉด, ๊ด๋ จ ์์ด ๋ณด์ด์ง๋ง ๊ถ๊ทน์ ์ผ๋ก๋ ์ง๋ฌธ์ ๋์์ด ๋์ง ์๋ ํผ์์ ์ธ ์ ๋ณด๊ฐ ๊ณผ๋ํ๊ฒ ๊ฒ์๋์ด LLM์ ์ค๋ํ๊ฑฐ๋ ๋ถํ์ํ ๊ณ์ฐ ์์์ ๋ญ๋นํ ์ ์์ต๋๋ค. ๋ฐ๋๋ก, ์์์ ์ฌ์ค ์ง์๋ฅผ ๋ช ์์ ์ฌ์ค ์ง์๋ก ์๋ชป ๋ถ๋ฅํ๋ฉด, ์ถฉ๋ถํ๊ณ ํฌ๊ด์ ์ธ ์ธ๋ถ ๋ณด์กฐ ๋ฐ์ดํฐ๋ฅผ ๊ฒ์ํ๊ธฐ ์ํ ์ ์ ํ ๋ฐฉ๋ฒ์ ์ฌ์ฉํ์ง ๋ชปํ ์ ์์ต๋๋ค. ์์์ ์ฌ์ค ์ง์๋ ๋๊ฐ ์ง์์ ๋งฅ๋ฝ์ ๋ฐ๋ผ ๋์ ์ผ๋ก ์ ๋ณด๋ฅผ ํตํฉํด์ผ ํ๋ ๋ฐ๋ฉด, ๋ช ์์ ์ฌ์ค ์ง์๋ ์ผ๋ฐ์ ์ผ๋ก ๋จ์ผ ๋ฐ์ดํฐ ์กฐ๊ฐ๋ง ํ์ํ๋ฉฐ ๊ณ ์ ๋ ์์ ์ธ๋ถ ๋ฐ์ดํฐ๋ฅผ ๊ฒ์ํ๋ ๊ฒ์ผ๋ก ์ถฉ๋ถํฉ๋๋ค. ๋ฐ๋ผ์ ์๋ชป๋ ๋ถ๋ฅ๋ LLM์ ์ฑ๋ฅ ์ ํ๋ก ์ด์ด์ง ์ ์์ต๋๋ค. ๋ฐ๋ผ์, ๋ชฉํ ์์ ์ ๋ํ ์ฒ ์ ํ ์ดํด๋ฅผ ๋ฐํ์ผ๋ก ์ง์์ ์์ค์ ์ฌ์ ์ ๊ตฌ๋ณํ๋ ๊ฒ์ด ์ ๋ฆฌํฉ๋๋ค. ๋ํ, ๊ฒ์๋ ์ ๋ณด๊ฐ ์ถฉ๋ถํ์ง ์ฌ๋ถ๋ฅผ ์์จ์ ์ผ๋ก ํ๊ฐํ ์ ์๋๋ก ๋ชจ๋ธ์ ํ๋ จํ๋ ๋ฐ ์๋นํ ๋ ธ๋ ฅ์ด ๊ธฐ์ธ์ฌ์ง๊ณ ์์ผ๋ฉฐ, Self-RAG [92]์ ๊ฐ์ ์ ๊ทผ๋ฒ์ด ๊ทธ ์์์ ๋๋ค.
5. Interpretable Rationale Queries (L3)
5.1 Overview
์ด ์น์ ๊ณผ ๋ค์ ์น์ ์์๋ ๋ฌธ์ ํด๊ฒฐ์ ์ํด ์ธ๋ถ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ์ฌ ๊ทผ๊ฑฐ(rationale)๋ฅผ ์ ๊ณตํด์ผ ํ๋ ์ง์๋ฅผ ํ๊ตฌํฉ๋๋ค. ์ด๋ฌํ ์ง์๋ ์ฌ์ค์ ๋ด์ฉ์ ์ดํดํ๋ ๊ฒ๋ฟ๋ง ์๋๋ผ, ๋ฐ์ดํฐ์ ๋งฅ๋ฝ์ ๋ด์ฌ๋ ๋๋ฉ์ธ์ ํนํ๋ ๊ทผ๊ฑฐ๋ฅผ ์ดํดํ๊ณ ์ ์ฉํ ์ ์๋ ๋ฅ๋ ฅ์ ์๊ตฌํฉ๋๋ค. ์ฐ๋ฆฌ๋ ์ด๋ฌํ ์ง์๋ฅผ ๋ ผ๊ฑฐ์ ํน์ฑ์ ๋ฐ๋ผ ํด์ ๊ฐ๋ฅํ ๊ทผ๊ฑฐ์ ๊ธฐ๋ฐํ ์ง์์ ์จ๊ฒจ์ง ๊ทผ๊ฑฐ์ ๊ธฐ๋ฐํ ์ง์์ ๋ ๊ฐ์ง ๋ฒ์ฃผ๋ก ๋ถ๋ฅํฉ๋๋ค. ์ด ๋ด์ฉ์ Figure 04์ ๋ํ๋ ์์ต๋๋ค.
ํด์ ๊ฐ๋ฅํ ๊ทผ๊ฑฐ์ ๊ธฐ๋ฐํ ์ง์๋ ์ธ๋ถ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ์ฌ ๊ทผ๊ฑฐ๋ฅผ ์ ๊ณตํด์ผ ํ๋ ์ ํ๋ฆฌ์ผ์ด์ ์ค ๋น๊ต์ ๋จ์ํ ๋ฒ์ฃผ์ ์ํฉ๋๋ค. ์ด ์ ํ์ ์ง์๋ฅผ ์ํ ๋ณด์กฐ ๋ฐ์ดํฐ๋ ๋ฌธ์ ํด๊ฒฐ์ ์ฌ์ฉ๋๋ ์ฌ๊ณ ๊ณผ์ ์ ๋ช ํํ๊ฒ ์ค๋ช ํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค. ์ด๋ฌํ ๋ฐ์ดํฐ๋ ์ฌ๋ฌ ๊ฐ์ง ํ์์ผ๋ก ๊ตฌ์ฑ๋ ์ ์์ต๋๋ค:
Plain Text : ํ ์คํธ๋ก ํํ๋ ์ค๋ช ์ ํด์ ๊ฐ๋ฅํ ๋ ผ๊ฑฐ๋ฅผ ์ ๊ณตํ๋ ๊ฐ์ฅ ์ผ๋ฐ์ ์ธ ํ์์ ๋๋ค. ์ฌ๊ธฐ์๋ ํธ๋๋ถ, ๊ฐ์ด๋๋ผ์ธ๊ณผ ๊ฐ์ ์ ๋ฌธ ๋ฌธ์๋ ๋๋ฉ์ธ ํนํ ๋งค๋ด์ผ, ์ด์ ๊ฐ์ด๋๊ฐ ํฌํจ๋ ์ ์์ต๋๋ค. ์ด๋ฌํ ํ ์คํธ๋ ๋ณต์กํ ์ํฉ์์ ์์ฌ๊ฒฐ์ ์ ์ฉ์ดํ๊ฒ ํ๋ ์ถ๋ก ๊ณผ์ ์ ๋ช ํํ ์ค๋ช ํฉ๋๋ค. ์๋ฅผ ๋ค์ด, ์ ์ฝ ๊ณต์ฅ์ ์ํ FDA ์ง์นจ์ด๋ ์์ฌ๋ฅผ ์ํ ์ฝ๋ฌผ ์ฌ์ฉ ๊ฐ์ด๋๋ FDA ๊ฒ์ฌ๊ด์ด๋ ์์ฌ์ ๊ฐ์ ์ ๋ฌธ๊ฐ๋ค์ด ํน์ ์ฌ๋ก์ ์ ๊ทผํ๋ ๋ฐฉ์์ ๋ณด์ฌ์ค๋๋ค.
Structured Instruction : ๋ ๋ช ํํ ์ถ๋ก ๊ด๊ณ๋ ์์ฌ๊ฒฐ์ ๊ฒฝ๋ก๋ ๊ตฌ์กฐํ๋ ํ์์ผ๋ก ์ ์๋ ์ ์์ต๋๋ค. ์ด๋ฌํ ๋ ผ๊ฑฐ๋ ํ ์คํธ ์กฐ๊ฑด ๊ธฐ๋ฐ ๋ฌด์ด ๋จธ์ (Text-Conditioned Moore Machine) ๋๋ **ํ ์คํธ ์กฐ๊ฑด ๊ธฐ๋ฐ ๋ฐ๋ฆฌ ๋จธ์ (Text-Conditioned Mealy Machine)**์ผ๋ก ์ดํด๋ ์ ์์ต๋๋ค.
๋ฌด์ด ๋จธ์ ์ ์ถ๋ ฅ ๊ฐ์ด ํ์ฌ ์ํ์ ์ํด์๋ง ๊ฒฐ์ ๋๋ ์ ํ ์ํ ๋จธ์ ์ ๋๋ค. ์ํ ์ ํ์ ์ ์ดํ๋ ์กฐ๊ฑด์ ํ ์คํธ๋ก ํํ๋๋ฉฐ, ์ด๋ LLM์ด ํด์ํด์ผ ํฉ๋๋ค. ์๋ฅผ ๋ค์ด, ๊ณ ๊ฐ ์ง์ ์์ด์ ํธ๊ฐ ์ ํ ๊ตํ์ด๋ ํ๋ถ ์์ฒญ์ ์ฒ๋ฆฌํ๊ธฐ ์ํด ํธ๋๋ถ์ ๋ฐ๋ฅด๋ ๊ฒฝ์ฐ๊ฐ ์ด์ ํด๋นํฉ๋๋ค.
๋ฐ๋ฆฌ ๋จธ์ ์ ์ถ๋ ฅ ๊ฐ์ด ํ์ฌ ์ํ์ ์ ๋ ฅ ๋ชจ๋์ ์ํด ๊ฒฐ์ ๋๋ ์ ํ ์ํ ๋จธ์ ์ ๋๋ค. ์ฌ๊ธฐ์ ์ก์ (API ํธ์ถ ๋ฑ)์ ํ์ฌ ์ํ๋ฟ๋ง ์๋๋ผ ์ด์ ์ํ์ ์ ํ๊ณผ ๊ด๋ จ๋ ํ ์คํธ ๋ฉ์์ง์ ์ํด ๊ฒฐ์ ๋ฉ๋๋ค.
๋๋ฉ์ธ ํนํ ๋ ผ๊ฑฐ๋ ์ํฌํ๋ก์ฐ, ์์ฌ๊ฒฐ์ ํธ๋ฆฌ, ์์ฌ์ฝ๋(pseudocode)์ ๊ฐ์ ํ์์ผ๋ก ํํ๋ ์ ์์ต๋๋ค.
ํด๋น ๋ ๋ฒจ์์์ ์ง์ ์์
๊ฐ์ด ํต์ฆ๊ณผ ํน์ ์ฆ์ ์ค๋ช ์ด ์๋ ํ์๋ ์ด๋ป๊ฒ ์ง๋จํ๊ณ ์น๋ฃํด์ผ ํ๋๊ฐ? (๊ฐ์ด ํต์ฆ ๊ด๋ฆฌ ์ง์นจ์ด ์ฃผ์ด์ง ๊ฒฝ์ฐ)
์ค์ ์ํฉ์์ ์ฌ์ฉ์์ ์ง๋ฌธ์ ์ด๋ป๊ฒ ์๋ตํด์ผ ํ๋๊ฐ? (๊ณ ๊ฐ ์๋น์ค ์ํฌํ๋ก์ฐ๊ฐ ์ฃผ์ด์ง ๊ฒฝ์ฐ)
5.2 Challenges and Solution
ํด์ ๊ฐ๋ฅํ ๋ ผ๊ฑฐ ์ง์(interpretable rationale queries) ์์ญ์์๋ ๋๋ฉ์ธ ํนํ ๋ ผ๊ฑฐ๋ฅผ LLM์ ์ดํดํ๊ธฐ ์ฌ์ด ๋ฐฉ์์ผ๋ก ํตํฉํ๋ ๋ฐ ์ถ๊ฐ์ ์ธ ๋์ ๊ณผ์ ๊ฐ ์กด์ฌํฉ๋๋ค. ์ฃผ์ ๊ณผ์ ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
ํ๋กฌํํธ ์ต์ ํ ๋น์ฉ(Prompt Optimization Costs) : ํ๋กฌํํธ๋ฅผ ์ต์ ํํ๋ ๊ณผ์ ์ ๋์ ์๊ฐ์ , ๊ณ์ฐ์ ์์์ ์๊ตฌํฉ๋๋ค. ๊ฐ๊ธฐ ๋ค๋ฅธ ์ง์๋ ๋ง์ถคํ ๋ฐฐ๊ฒฝ ์ง์๊ณผ ์์ฌ๊ฒฐ์ ๊ธฐ์ค์ ํ์๋ก ํ๋ฉฐ, ์ด๋ฅผ ์ํด ๋ค์ํ ์์๊ฐ ์๊ตฌ๋ฉ๋๋ค. ์๋์ผ๋ก ์ค๊ณ๋ ํ๋กฌํํธ๋ ๋งค์ฐ ํจ๊ณผ์ ์ผ ์ ์์ง๋ง, ๋ง์ ๋ ธ๋๋ ฅ๊ณผ ์๊ฐ์ด ์์๋ฉ๋๋ค. ๋ํ, ๋ค์ํ ์ง์์ ๋ง์ถคํ ํ๋กฌํํธ๋ฅผ ์์ฑํ๋๋ก ๋ชจ๋ธ์ ํ๋ จ์ํค๋ ๊ณผ์ ์ ์๋นํ ๊ณ์ฐ ๋น์ฉ์ ์ด๋ํฉ๋๋ค.
์ ํ๋ ํด์ ๊ฐ๋ฅ์ฑ(Limited Interpretability) : ํ๋กฌํํธ๊ฐ LLM์ ๋ฏธ์น๋ ์ํฅ์ ๋ถํฌ๋ช ํฉ๋๋ค. ๋ง์ ๊ฒฝ์ฐ, LLM์ ๋ด๋ถ ๋งค๊ฐ๋ณ์์ ์ ๊ทผํ๋ ๊ฒ์ด ์ ํ์ ์ด๊ธฐ ๋๋ฌธ์ ๋ค์ํ ํ๋กฌํํธ๊ฐ ๋ชจ๋ธ์ ์ด๋ค ์ํฅ์ ๋ฏธ์น๋์ง ํ์ ํ๋ ์ผ์ด ์ด๋ ต์ต๋๋ค. ์ด๋ฌํ ํฌ๋ช ์ฑ ๋ถ์กฑ์ LLM์ด ์๋ก ๋ค๋ฅธ ํ๋กฌํํธ์ ๋ํด ์์ฑํ ์๋ต์ ํด์ ๊ฐ๋ฅ์ฑ์ ์ผ๊ด๋๊ฒ ์ดํดํ๊ณ ๊ฒ์ฆํ๋ ๋ฐ ์ฅ์ ๋ฌผ์ด ๋ฉ๋๋ค.
5.3 Prompt Tuning
ํด์ ๊ฐ๋ฅํ ๋ ผ๊ฑฐ ์ง์์์๋ ์ธ๋ถ ๋ฐ์ดํฐ์์ ์ ๊ณต๋ ๋ ผ๊ฑฐ๋ฅผ LLM์ ํจ๊ณผ์ ์ผ๋ก ํตํฉํ๊ณ , ๋ชจ๋ธ์ด ์ด๋ฌํ ๋ ผ๊ฑฐ๋ฅผ ์ ํํ ๋ฐ๋ฅด๊ณ ๋ฐ์ํ๋๋ก ๋ณด์ฅํ๋ ๊ฒ์ด ํต์ฌ ๊ณผ์ ์ ๋๋ค. Text2MDT [112]๋ ์ด์ ๊ด๋ จํด ์ ์ฉํ ์ฌ๋ก๋ฅผ ์ ์ํ๋ฉฐ, ์ํ ๊ฐ์ด๋๋ผ์ธ๊ณผ ๊ต๊ณผ์์์ ์ํ์ ์์ฌ๊ฒฐ์ ํธ๋ฆฌ๋ฅผ ์๋์ผ๋ก ์ถ์ถํ๋ ๋ ๊ฐ์ง ๋ฐฉ๋ฒ์ ์๊ฐํฉ๋๋ค. ์ด ๊ณผ์ ์ ํตํด ๊ธด ์ํ ํ ์คํธ ๋ด ๋ ผ๋ฆฌ์ ์ฒด๊ณ๋ฅผ ๋ช ํํ ํ์ฌ ์ดํด๋ฅผ ๋ ์ฉ์ดํ๊ฒ ๋ง๋ญ๋๋ค. ์ด์ ์ ์ฌํ๊ฒ, MedDM [113]์ LLM์ด ์คํ ๊ฐ๋ฅํ ์์ ๊ฐ์ด๋ ํธ๋ฆฌ(CGT)๋ฅผ ๊ฐ๋ฐํ๊ณ , ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ถ๋ก ํ๋ ๋ฐฉ๋ฒ๋ก ๊ณผ ํ์์ LLM ๊ฐ ๋ค์ค ๋ํ ํด์ ์ํ ํ๋ ์์ํฌ๋ฅผ ์ ์ํฉ๋๋ค. InstructRec [114]๋ ์ถ์ฒ ์์คํ ์์ LLM์ ์ญ๋์ ํ์ฉํ๊ธฐ ์ํด, ์ฌ์ฉ์์ ์ ํธ๋, ์๋, ์์ ํํ, ๋งฅ๋ฝ์ ์์ฐ์ด๋ก ์ค๋ช ํ๋ ๋ฒ์ฉ ํฌ๋งท์ ์ค๊ณํ์ฌ ๊ณ ์ฑ๋ฅ ์ธ์ด ๊ธฐ๋ฐ ์ถ์ฒ ์์คํ ์ ๊ตฌ์ถํฉ๋๋ค.
๋ ผ๊ฑฐ๋ฅผ ์์ฐ์ด ์ง์นจ์ผ๋ก LLM์ ์ง์ ํตํฉํ๋ ๊ฒ์ด ํญ์ ์ต์ ์ ์ฑ๋ฅ์ ๋ณด์ฅํ์ง๋ ์์ผ๋ฉฐ, ์๋์ผ๋ก ํ๋กฌํํธ๋ฅผ ์ค๊ณํ๋ ๋ฐ๋ ๋ง์ ์๊ฐ์ด ์์๋ฉ๋๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ํ๋กฌํํธ ํ๋(prompt tuning) ๊ธฐ์ ์ด ํ์์ ์ด๋ฉฐ, ์ด๋ฅผ ํตํด LLM์ด ํน์ ๋ ผ๊ฑฐ๋ฅผ ๋ ์ ๋ฐ๋ฅผ ์ ์๋๋ก ๊ฐํํ ์ ์์ต๋๋ค. TEMPERA ํ๋ ์์ํฌ [115]: ์ ํ๋ ์ง์นจ, ์์ , ๋จ์ดํ(verbalizer)๋ฅผ ๊ฐํ ํ์ต์ ์ก์ ๊ณต๊ฐ์ ํฌํจํ๋ ํ๋กฌํํธ๋ฅผ ์ค๊ณํฉ๋๋ค. ์ด ๊ณผ์ ์์ LLM์ด ์ ํํ ์๋ต์ ์์ฑํ ํ๋ฅ ์ ๋ณด์์ผ๋ก ์ผ์, ๋ฐ์ดํฐ์ ์ ๋ฐ์์ ์ต์ ์ ํ๋กฌํํธ ๊ตฌ์ฑ์ ๋ฐ๊ฒฌํ๋๋ก ๋ชจ๋ธ์ ์๋ดํฉ๋๋ค. RLPrompt [116]: ๊ฐํ ํ์ต ๊ธฐ๋ฒ์ ์ฌ์ฉํด ์ด๋ํฐ๋ฅผ ํ๋ จ์์ผ, LLM์ ์๋ต ์ ํ์ฑ์ ๋ํ ํผ๋๋ฐฑ์ ๊ธฐ๋ฐ์ผ๋ก ์์ ์ธ์ด ๋ชจ๋ธ์ด ์ต์ ์ ํ๋กฌํํธ๋ฅผ ์์ฑํ ์ ์๋๋ก ๋์ต๋๋ค. Directional Stimulus Prompting: LLM์ ๋ค์ด์คํธ๋ฆผ ์์ ์ฑ๋ฅ์ ๋ณด์ ๋ฉ์ปค๋์ฆ์ผ๋ก ํ์ฉํ์ฌ, ๊ฐ๋ณ ์ฌ๋ก์ ๋ง์ถ ํน์ ๋จ์๋ ํค์๋๋ฅผ ํ๋กฌํํธ๋ก ์ฌ์ฉํ๋๋ก ๋ชจ๋ธ์ ํ๋ จํฉ๋๋ค. ์ด๋ฅผ ํตํด LLM์ ํ๋์ด ์์ ๊ฒฐ๊ณผ์ ๋์ฑ ์ ๋ถํฉํ๋๋ก ํฉ๋๋ค.
GrIPS [117]: ์๊ท๋ชจ ๋ฐ์ดํฐ์ ์ ํ๊ฐ ๊ธฐ์ค์ผ๋ก ์ฌ์ฉํ์ฌ ๋ค์ํ ํ๋กฌํํธ ์์ (์ญ์ , ๊ต์ฒด, ํจ๋ฌํ๋ ์ด์ง, ์ถ๊ฐ)์ ์คํํจ์ผ๋ก์จ ์ ์ํ๊ณ ํจ๊ณผ์ ์ผ๋ก ์ต์ ์ ํ๋กฌํํธ ๊ตฌ์ฑ์ ์ฐพ์๋ ๋๋ค.
OPRO [120]: LLM์ด ๊ณผ๊ฑฐ ๋ฐ์ดํฐ์ ํด๋น ์ฑ๋ฅ ์งํ๋ฅผ ๋ฐํ์ผ๋ก ์๋ก์ด ํ๋กฌํํธ ์๋ฃจ์ ์ ์์ฑํ๊ณ , ์ด๋ฅผ ํ๊ฐํ์ฌ ์ต์ ํ ๊ณผ์ ์ ๊ฐ์ํํฉ๋๋ค. Reflexion [121]: ์ธ์ด์ ํผ๋๋ฐฑ์ ๊ธฐ๋ฐ์ผ๋ก ํ๋กฌํํธ ์ต์ ํ๋ฅผ ์ํํ๋ ์๋ก์ด ์ ๊ทผ๋ฒ์ผ๋ก, LLM ์ถ๋ ฅ์ ๋ถ์ํ๊ณ ์ด๋ฅผ ์ํผ์๋ ๋ฉ๋ชจ๋ฆฌ ๋ฒํผ์ ์ ์ฅํฉ๋๋ค. ์ด ๋ฉ๋ชจ๋ฆฌ๋ ๊ณผ๊ฑฐ์ ํต์ฐฐ์ ํ์ฉํด ์์ฌ๊ฒฐ์ ์ ์ ๊ตํํ๊ณ , ํฅํ ์ํธ์์ฉ์์ ๊ฒฐ๊ณผ๋ฅผ ํ๊ฐํ๋ ๋ฐ ๋์์ ์ค๋๋ค. ์ด๋ฌํ ์ ๊ทผ๋ฒ๋ค์ ํ๋กฌํํธ ์ต์ ํ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ํํ๋ฉฐ, LLM์ ์ฑ๋ฅ์ ํฅ์์ํค๊ณ ๋ค์ํ ๋๋ฉ์ธ ํนํ ๋ ผ๊ฑฐ๋ฅผ ํ์ฉํ๋ ๋ฐ ์ค์ํ ์ญํ ์ ํฉ๋๋ค.
5.4 CoT Prompting
๋ณต์กํ ๋ ผ๊ฑฐ๋ฅผ ์ฒ๋ฆฌํ๋ ค๋ฉด LLM์ด ํ์ฅ๋ ์ถ๋ก ์ฒด์ธ์ ์ํํด์ผ ํ๋ฉฐ, ์ด๋ ์ผ๋ฐ์ ์ธ ์ฌ์ค ์ง์์์์ ์ด์ง์ ์ธ ์ฌ์ค ์ ๋ณด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ ์ถ๋ก ๊ณผ๋ ๊ตฌ๋ณ๋ฉ๋๋ค. ๊ทธ๋ฌ๋ Chain-of-Thoughts (CoT) [122], Tree-of-Thoughts [123], ๋๋ Graph-of-Thoughts [124]์ ๊ฐ์ ๋ฐฉ๋ฒ๋ก ์ ์ด๋ฌํ ์๋๋ฆฌ์ค์์ ํจ๊ณผ์ ์์ด ์ ์ฆ๋์์ต๋๋ค. ์ด๋ฌํ ์ฐ๊ตฌ๋ค์ ๋ง์ด ์ฐ๊ตฌ๋์๊ณ ์ผ๋ฐ์ ์ธ ์ ์ฉ ๊ฐ๋ฅ์ฑ์ด ๋์ ๋ฌธ์ ์ ๋ํด์๋ ์๋์ผ๋ก CoT ํ๋กฌํํธ๋ฅผ ์ค๊ณํ๋ ๊ฒ์ด ์ ์ฉํ ํด๊ฒฐ์ฑ ์ผ๋ก ๋ํ๋ฌ์ต๋๋ค. Ji et al. (2023) [125]๋ ์ง์ ์ต๋๊ณผ ๋ต๋ณ ์์ฑ์ ํตํฉํ ์๊ธฐ ๋ฐ์ฑ(self-reflection) ๋ฐฉ๋ฒ์ ์ ์ํ์ต๋๋ค. ์ธ๋ถ ๋๊ตฌ๋ฅผ ํ์ฉํ๊ณ ํ๋กฌํํธ๋ฅผ ์ค๊ณํ์ฌ, ๋ค์ ์ธ ๊ฐ์ง ์ ํ์ ์๊ธฐ ๋ฐ์ฑ ๋ฃจํ๋ฅผ ๊ตฌ์ถํ์ต๋๋ค: ์ฌ์ค์ ์ง์ ์ต๋ ๋ฃจํ(Factual Knowledge Acquiring Loop), ์ง์ ์ผ๊ด์ฑ ๋ต๋ณ ๋ฃจํ(Knowledge-Consistent Answering Loop), ์ง๋ฌธ ํจ์ ๋ต๋ณ ๋ฃจํ(Question-Entailment Answering Loop). ์ด ๋ฃจํ๋ฅผ ํตํด ์ธ๋ถ ๋ ผ๊ฑฐ๋ฅผ ๋ชจ๋ธ ์ฒ๋ฆฌ ๊ณผ์ ์ ํตํฉํ์ต๋๋ค. ๋ํ, Wu et al. (2024) [126]๋ ์์ ๊ธฐ๋ก์์ ๋ฐ์ํ๋ ์ค๋ฅ ์ ํ์ ์๋์ผ๋ก ๋ถ์ํ๊ณ , GPT-4 ๋ชจ๋ธ [127]์ด ๊ฐ์ , ์ง๋จ, ๊ด๋ฆฌ ์ค๋ฅ์ ์ด์ ์ ๋ง์ถ๋๋ก ์ ๋ํ๋ ์ธ ๊ฐ์ง CoT ํ๋กฌํํธ๋ฅผ ๊ฐ๋ฐํ์ต๋๋ค. ์ด ๋ง์ถคํ ํ๋กฌํํธ๋ ์์ ๊ธฐ๋ก์์ ์๋ ์ค๋ฅ ๊ฐ์ง, ์คํฌ ์๋ณ, ์์ ์์ ์ ์ง์ํฉ๋๋ค.
์๋ CoT ํ๋กฌํํธ ์ค๊ณ๋ ๋งค์ฐ ํจ๊ณผ์ ์ด์ง๋ง, ์๋นํ ์ธ์ ์์๊ณผ ์๊ฐ์ด ํ์ํฉ๋๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด Automate-CoT [128]๋ ์ต์ํ์ ๋ ์ด๋ธ๋ง์ด ๋ ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ์ฌ ๋ ผ๊ฑฐ ์ฒด์ธ์ ์ฆ๊ฐํ๋ ๊ธฐ์ ์ ์ ์ํ์ต๋๋ค. ์ด ์ ๊ทผ๋ฒ์ ๋ถ์ฐ ๊ฐ์ ์ ์ฑ ๊ฒฝ์ฌ(variance-reduced policy gradient) ์ ๋ต์ ์ฌ์ฉํด ๊ฐ CoT ์ฒด์ธ์ ์ค์์ฑ์ ํ๊ฐํ๋ฉฐ, ๊ฐ์ฅ ํจ๊ณผ์ ์ธ ํ๋กฌํํธ ์กฐํฉ์ ์ ํํ ์ ์๋๋ก ์ง์ํฉ๋๋ค.
Chain of Thoughts ํ๋กฌํํ ์ ํ์ฉํ๋ ๋ ๋ค๋ฅธ ๋ฐฉ๋ฒ์ LLM์ ์ค์ฌ์ผ๋ก ์์ด์ ํธ ์ํฌํ๋ก์ฐ๋ฅผ ๊ตฌ์ถํ๋ ๊ฒ์ ๋๋ค. ์ด๋ ๋ค์ํ ์ค์ ์๋๋ฆฌ์ค๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ณด๋ค ํฌ๊ด์ ์ธ ์์คํ ๊ฐ๋ฐ์ ์๊ตฌํฉ๋๋ค. **Wang et al.**์ ๋ฐ๋ฅด๋ฉด, ์ด๋ฌํ ์์คํ ์ ํ๋กํ์ผ๋ง(profiling), ๋ฉ๋ชจ๋ฆฌ(memory), ๊ณํ(planning), ํ๋(action) ๋ชจ๋๋ก ํฌ๊ฒ ๊ตฌ๋ถ๋ ์ ์์ต๋๋ค [129]. ํด์ ๊ฐ๋ฅํ ๋ ผ๊ฑฐ๋ ๋ค์ํ ํํ๋ก ์ฌ๋ฌ ๋ชจ๋์ ํตํฉ๋ ์ ์์ผ๋ฉฐ, ์ด๋ฅผ ํตํด ์์ด์ ํธ๊ฐ ํ๊ฒฝ ๋๋ ์ธ๊ฐ์ ํผ๋๋ฐฑ์ ๋ฐ๋ผ ์ ์ํ๊ณ ๋ฐ๋ณตํ ์ ์์ต๋๋ค.
์ต๊ทผ ์ฐ๊ตฌ์์๋ ์ถ๋ก ์ฒด์ธ์ ํ์ง์ ์๋์ผ๋ก ํ๊ฐํ๋ ๋ฐฉ๋ฒ๋ก ์ด ๋ฐ์ ํ๊ณ ์์ต๋๋ค. LLM Reasoners [130]์ SocREval [131]๊ณผ ๊ฐ์ ์ต์ ๊ธฐ์ ์ ์ด๋ฌํ ํ๊ฐ๋ฅผ ํตํด ๊ฐ๋ ฅํ ๋ฐ์ดํฐ ์ฆ๊ฐ ๊ธฐ๋ฐ LLM ์ ํ๋ฆฌ์ผ์ด์ ์ ๊ตฌ์ถํ๋ ๋ฐ ๊ธฐ์ฌํฉ๋๋ค. ์ด ๋ฐฉ๋ฒ๋ก ๋ค์ ๋ ผ๊ฑฐ ์ฒด์ธ์ ํ์ง์ ๋ณด์ฅํ๊ณ , ๋ ๋์ ์ฑ๋ฅ์ LLM ์ ํ๋ฆฌ์ผ์ด์ ๊ฐ๋ฐ์ ์ง์ํฉ๋๋ค.
ํด์ ๊ฐ๋ฅํ ๋ ผ๊ฑฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ ์ ํ๋ฆฌ์ผ์ด์ ์ ๋ค์ํ ๋ถ์ผ์์ ํ์ฉ๋๊ณ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, CoML [132]์ AutoML ์ง์์ ํ๋กฌํํธ๋ก LLM์ ํตํฉํ๊ณ , ๊ณผ๊ฑฐ ์คํ ๊ธฐ๋ก์์ ์ ์ฉํ ์ ๋ณด๋ฅผ ๋์ ์ผ๋ก ๊ฒ์ํ ํ ์ด๋ฅผ ๊ฒฐํฉํ์ฌ LLM์ด ์๋ก์ด ์์ ์ ์ํ ๋จธ์ ๋ฌ๋ ์๋ฃจ์ ์ ๊ฐ๋ฐํ ์ ์๋๋ก ์ง์ํฉ๋๋ค. MetaGPT [133]๋ ์ํํธ์จ์ด ๊ฐ๋ฐ์ ์ํ ๋ค์ค ์์ด์ ํธ ์์คํ ์ ๊ฐ๋ฐํ์ผ๋ฉฐ, ํ๋ก์ ํธ ๋ด ๋ค์ํ ์ดํด๊ด๊ณ์๋ฅผ ๊ฐ๊ฐ ์์ด์ ํธ๋ก ํํํฉ๋๋ค. ์ด ์์คํ ์ ์ฌ๋ฌ ์์ด์ ํธ๊ฐ ์ค์ ์ ๋ฌด ํ์ดํ๋ผ์ธ์ ๋ฐ๋ผ ํ์ ํ์ฌ ์ํํธ์จ์ด ๊ฐ๋ฐ ์์ ์ ํจ๊ณผ์ ์ผ๋ก ์๋ฃํ ์ ์๋๋ก ํฉ๋๋ค.
์ด์ ์ ์ฌํ๊ฒ, ๊ณ ๋ํ๋ ์์ด์ ํธ ์์คํ ์ ๊ณ ๊ฐ ์๋น์ค [134] ๋ฐ ์๋ฃ ์ง๋ฌธ ์๋ต [135]๊ณผ ๊ฐ์ ๋ถ์ผ์์๋ ์ค๊ณ๋๊ณ ์์ต๋๋ค. ์ด๋ฌํ ๋๋ฉ์ธ์์ ์์ด์ ํธ๋ ํน์ ์ ํ์ ์์ฒญ์ ์ฒ๋ฆฌํ๋๋ก ๋ง์ถค ์ค๊ณ๋๋ฉฐ, ์ด๋ ๋ณต์กํ ์ฌ์ฉ์ ์์ฒญ์ ์ดํดํ๊ฑฐ๋ ์ ํํ ์๋ฃ ์ ๋ณด๋ฅผ ์ ๊ณตํ๋ ์์ ์ ํฌํจํ ์ ์์ต๋๋ค. ์ด๋ฌํ ์์คํ ์ ์ํธ์์ฉ์ ํ์ง์ ํฅ์์ํฌ ๋ฟ๋ง ์๋๋ผ ์๋ต์ ํจ์จ์ฑ๊ณผ ์ ํ์ฑ์ ๋์ด๋ฉฐ, ์ ์ค๊ณ๋ ์์ด์ ํธ ์ํฌํ๋ก์ฐ์ LLM์ ํตํฉํ์ ๋ ๊ทธ ์ ์ฐ์ฑ๊ณผ ์ ์ฌ๋ ฅ์ ๋ณด์ฌ์ค๋๋ค.
6. Hidden Rationale Queries (L4)
6.1 Overview
์จ๊ฒจ์ง ๋ ผ๊ฑฐ ์ง์๋ ํด๊ฒฐํ๊ธฐ ๊ฐ์ฅ ์ด๋ ค์ด ์ ํ์ ์ง์์ ์ํฉ๋๋ค. ํด์ ๊ฐ๋ฅํ ๋ ผ๊ฑฐ ์ง์๊ฐ ๋ช ํํ ์ง์นจ์ ์ ๊ณตํ์ฌ ์ง์์ ์๋ตํ๋ ๋ฐ ํ์ํ ๋ ผ๊ฑฐ๋ฅผ ๋ช ์์ ์ผ๋ก ์ ์ํ๋ ๊ฒ๊ณผ ๋ฌ๋ฆฌ, ์จ๊ฒจ์ง ๋ ผ๊ฑฐ ์ง์๋ ๋ช ์์ ์ผ๋ก ์ค๋ช ๋์ง ์๊ณ ๋งค์ฐ ๋ค์ํ๋ฉฐ, ๋ชจ๋ ๊ฒฝ์ฐ๋ฅผ ๋ค ๋ค๋ฃจ๊ธฐ์๋ ๋๋ฌด ๋ฐฉ๋ํฉ๋๋ค. ์ด๋ฌํ ๋ ผ๊ฑฐ๋ ์ผ๋ฐ์ ์ธ ์ปจํ ์คํธ ์๋์ฐ ๋ด์์ ์์ ํ ํ๊ตฌํ ์ ์์ ์ ๋๋ก ๊ด๋ฒ์ํ๋ฉฐ, ๋ช ํํ ์ง์นจ์ด ๋ถ์กฑํ ์ ์์ต๋๋ค. ์ด๋ ๋ฐ์ดํฐ ๋ด์ ์๋ฌต์ ์ผ๋ก ํฌํจ๋ ํํ์ ๋๋ฉ์ธ ์ ๋ฌธ์ฑ์ ๋ํ๋ ๋๋ค. ์ด์ ๊ฐ์ ๋ฐ์ดํฐ์๋ ๋ค์์ด ํฌํจ๋ ์ ์์ต๋๋ค:
In Domain Data : ์จ๊ฒจ์ง ๋ ผ๊ฑฐ ์ง์๋ ๋์ผํ ๋๋ฉ์ธ์ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ ์ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, ๊ณผ๊ฑฐ์ ์ง๋ฌธ-์๋ต ๊ธฐ๋ก์ด๋ ์ธ์์ ์ผ๋ก ์์ฑ๋ ๋ฐ์ดํฐ๊ฐ ์ด์ ํด๋นํฉ๋๋ค. ์ด๋ฌํ ๋๋ฉ์ธ ๋ด๋ถ ๋ฐ์ดํฐ๋ ํ์ฌ ์ง์๋ฅผ ํด๊ฒฐํ๋ ๋ฐ ํ์ํ ์ถ๋ก ๊ธฐ์ ์ด๋ ๋ฐฉ๋ฒ๋ก ์ ๋ณธ์ง์ ์ผ๋ก ํฌํจํ๊ณ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, Python ํ๋ก๊ทธ๋๋ฐ ํผ์ฆ๊ณผ ๊ฐ์ ๋งฅ๋ฝ์์๋ ๊ณผ๊ฑฐ ๋ฌธ์ ์ ํด๊ฒฐ์ฑ ์ ํฌํจ๋ ๊ณ ์ ์๊ณ ๋ฆฌ์ฆ๊ณผ ๋ฌธ์ ํด๊ฒฐ ์ ๋ต์ด ํ์ฌ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๋ฐ ๋์์ด ๋ ์ ์์ต๋๋ค.
Preliminary Knowledge : ์จ๊ฒจ์ง ๋ ผ๊ฑฐ์ ๋ ๋ค๋ฅธ ํํ๋ ๋ค์ํ ์๋๋ฆฌ์ค์ ๋ฐ๋ผ ์ ์ฉ๋๋ ๋ฐฉ๋ํ ๋ถ์ฐ ์ง์ ๊ธฐ๋ฐ์ ๋๋ค. ์ด ๊ธฐ์ด ์ง์์ ๋ฒ์ ํ๋จ์ ๊ทผ๊ฐ์ด ๋๋ ๋ชจ๋ ์ง์ญ ๋ฒ๋ฅ ๊ณผ ๊ฐ์ ํฌ๊ด์ ์ธ ๊ณต๋ฆฌ์ ์์คํ ์ ํฌํจํ ์ ์์ต๋๋ค. ๋ํ, ์ํ์ ์ฆ๋ช ๊ณผ ๊ฐ์ ๋ถ์ผ์์ ์ถ๋ก ๊ณผ์ ์ ๋จ์ํํ๋ ๋ฐ ๋์์ด ๋๋ ๊ฒ์ฆ๋ ์ค๊ฐ ๊ฒฐ๋ก ์ ํฌํจํ ์๋ ์์ต๋๋ค. ํ์ค ์ธ๊ณ์ ๋ฌธ์ ๋ฅผ ์ธ๋ถ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํด ํด๊ฒฐํ ๋, ์ด๋ฌํ ๊ธฐ์ด ์ง์์ ์ธ๊ฐ ๊ฒฝํ๊ณผ ์ค์ฆ์ ์์ฝ์ ๋ณต์กํ ์ถ์ ์์ ๋น๋กฏ๋ ์๋ ์์ต๋๋ค.
์จ๊ฒจ์ง ๋ ผ๊ฑฐ ์ง์๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด์๋ ๋ค์ํ ๋ฐ์ดํฐ ์์ค์ ๋ด์ฌ๋ ์ ์ฌ์ ์งํ๋ฅผ ํด๋ ํ๊ณ ํ์ฉํ ์ ์๋ ์ ๊ตํ ๋ถ์ ๊ธฐ๋ฒ์ด ํ์ํฉ๋๋ค. ์ด๋ RAG(๊ฒ์-์์ฑ ๊ฒฐํฉ) ์์คํ ์ด ๋ณต์กํ๊ณ ์์์ ์ธ ์ ๋ณด๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํด์ํ๊ณ ์ ์ฉํ๋ ๋ฐ ์์ด ์๋นํ ๋์ ์ ์ ๊ธฐํฉ๋๋ค.
ํด๋น ๋ ๋ฒจ์ ์ง์ ์์
๊ฒฝ์ ์ํฉ์ด ํ์ฌ์ ๋ฏธ๋ ๋ฐ์ ์ ์ด๋ค ์ํฅ์ ๋ฏธ์น ๊น์? (์ฌ๋ฌด ๋ณด๊ณ ์ ๋ชจ์์ด ์ฃผ์ด์ก์ผ๋ฉฐ, ๊ฒฝ์ ์ ๋ฐ ์ฌ๋ฌด์ ๋ ผ๊ฑฐ๊ฐ ์๊ตฌ๋จ)
์ซ์ 5, 5, 5, 1์ ์ฌ์ฉํ์ฌ 24๋ฅผ ๋ง๋๋ ๋ฐฉ๋ฒ์ ๋ฌด์์ธ๊ฐ์? (24ํฌ์ธํธ ๊ฒ์ ์์ ์ ํด๋น ๋ต์์ด ์ฃผ์ด์ง ๊ฒฝ์ฐ)
์ํ๊ฐ๋์คํ์์๋ ๋ถ๋ชจ๊ฐ ํด์ธ์์ ํ์ด๋ ์๋ ์๊ฒ ์๋ฏผ๊ถ์ ๋ถ์ฌํ ์ ์์ต๋๊น? (GLOBALCIT ์๋ฏผ๊ถ ๋ฒ๋ฅ ๋ฐ์ดํฐ์ [136]์ด ์ฃผ์ด์ง ๊ฒฝ์ฐ)
6.2 Challenges and Solutions
์จ๊ฒจ์ง ๋ ผ๊ฑฐ ์ง์๋ ๋ฐ์ดํฐ ์ฆ๊ฐ LLM ์ ํ๋ฆฌ์ผ์ด์ ๊ตฌ์ถ์ ์์ด ์๋นํ ๋์ ์ ์ ๊ธฐํ๋ฉฐ, ์ฃผ์ ์ด๋ ค์์ ๋ค์๊ณผ ๊ฐ์ ์์ญ์์ ๋ํ๋ฉ๋๋ค:
Logical Retrieval : ์จ๊ฒจ์ง ๋ ผ๊ฑฐ๋ฅผ ํฌํจํ๋ ์ง๋ฌธ์์๋ ์ธ๋ถ ๋ฐ์ดํฐ์ ์ ์ฉ์ฑ์ด ๋จ์ํ ๊ฐ์ฒด ์์ค์ ์ ์ฌ์ฑ์ด๋ ์๋ฏธ์ ์ ์ฌ์ฑ์ ์์กดํ์ง ์์ต๋๋ค. ๋์ , ๋ ผ๋ฆฌ์ ์ผ๊ด์ฑ์ด๋ ์ฃผ์ ์ ์ ๋ ฌ์ด ๋ ์ค์ํฉ๋๋ค. ์ผ๋ฐ์ ์ธ ๊ฒ์ ๋ฐฉ๋ฒ์ ์ง์์ ์ค์ ๋ชฉํ๋ฅผ ํฌ์ฐฉํ๊ฑฐ๋, ๋ฌธ์ ์ ๋ ผ๋ฆฌ์ ์ผ๋ก ์ ์ฌํ ํ ์คํธ ๋ถ๋ถ์ ์๋ณํ๋ ๋ฐ ์ด๋ ค์์ ๊ฒช๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค. ์ด๋ ๋จ์ํ ํ ์คํธ ์ ์ฌ์ฑ์ ์์กดํ๋ ๋์ , ๊ธฐ๋ณธ ๋ ผ๋ฆฌ ๊ตฌ์กฐ๋ฅผ ๋ถ์ํ๊ณ ์๋ณํ ์ ์๋ ๋ณด๋ค ์ ๊ตํ ๊ฒ์ ์๊ณ ๋ฆฌ์ฆ์ ๊ฐ๋ฐ์ ํ์๋ก ํฉ๋๋ค.
Data Insufficiency : ๊ธฐ๋ณธ์ ์ผ๋ก ์ธ๋ถ ๋ฐ์ดํฐ๋ ํ์ฌ ์ง์์ ๊ด๋ จ๋ ๋ช ํํ ์ง์นจ์ด๋ ๋ต๋ณ์ ๋ช ์์ ์ผ๋ก ํฌํจํ์ง ์์ ์ ์์ต๋๋ค. ๋์ , ๊ด๋ จ ์ ๋ณด๋ ์ข ์ข ๋ถ์ฐ๋ ์ง์์ ๋ด์ฌ๋์ด ์๊ฑฐ๋ ์์๋ฅผ ํตํด ์์์ ์ผ๋ก ์ ์๋ฉ๋๋ค. ์ด๋ฌํ ๊ฐ์ ์ ์ธ ์ ๋ณด ํํ์ ๋ฐ์ดํฐ ํด์ ๋ฐ ํตํฉ ๋ฅ๋ ฅ์ ์๊ตฌํ๋ฉฐ, LLM์ด ๋จํธ์ ์ด๊ฑฐ๋ ๊ฐ์ ์ ์ผ๋ก ๊ด๋ จ๋ ๋ฐ์ดํฐ ์์ค์์ ์ผ๊ด๋ ๋ต๋ณ์ ๋์ถํ ์ ์๋ ๊ฐ๋ ฅํ ์ญ๋์ ํ์๋ก ํฉ๋๋ค. ์ด๋ฌํ ๋์ ์ ์จ๊ฒจ์ง ๋ ผ๊ฑฐ ์ง์์ ๋ณต์ก์ฑ์ ํจ๊ณผ์ ์ผ๋ก ๋ค๋ฃจ๊ธฐ ์ํด LLM ํ๋ ์์ํฌ ๋ด์์ ์ ๊ตํ ๋ฐ์ดํฐ ํตํฉ ๋ฐ ์ถ๋ก ์ญ๋์ด ํ์์ ์์ ๊ฐ์กฐํฉ๋๋ค.
6.3 Offline Learning
์ด๋ฌํ ์ ํ์ ์ง์๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉํ๋ ์ ๊ทผ๋ฒ์ ๋ฐ์ดํฐ์ ์์ ๊ท์น๊ณผ ๊ฐ์ด๋๋ฅผ ์คํ๋ผ์ธ์ผ๋ก ์๋ณํ๊ณ ์ถ์ถํ ํ, ๊ด๋ จ ํญ๋ชฉ์ ๊ฒ์ํ๋ ๊ฒ์ ๋๋ค. ์ถ๋ก ๋ ผ๊ฑฐ๋ฅผ ์์ฑํ๊ธฐ ์ํด, STaR [137]๊ณผ LXS [138]์ ๊ฐ์ ์ฐ๊ตฌ๋ LLM์ ํ์ฉํ์ฌ ๋ ผ๊ฑฐ๋ฅผ ์์ฑํฉ๋๋ค.
STaR๋ ์๊ท๋ชจ ๋ฐ์ดํฐ์ ์์ ๋๊ท๋ชจ ๋ฐ์ดํฐ์ ์ผ๋ก ํ์ฅํ๊ธฐ ์ํด ๋ฐ๋ณต์ ์ธ ์์ ์ํ(few-shot) ์์ ๋ฐฉ๋ฒ์ ์ฌ์ฉํ๋ฉฐ, LXS๋ ํ์ต ๋ชจ๋ธ์ด ์ค๋ช ์ ์์ฑํ๊ณ , ๋นํ ๋ชจ๋ธ์ด ์ด๋ฅผ ํ๊ฐํ๊ณ ๊ฒ์ฆํ๋ ๋ ๊ฐ์ง ์ญํ ๋ก ๊ตฌ์ฑ๋ ์ค๋ช ์ถ์ถ ๊ณผ์ ์ ๋์ ํ์ต๋๋ค.
GL [139]์ ์ค๋ฅ๋ฅผ ์๋ณํ๊ณ ์ด๋ฅผ ์ผ๋ฐํํ์ฌ ๋ฏธ๋ ์์ ์ ์ํ ๊ฐ์ด๋๋ผ์ธ์ผ๋ก ์ ํํ๋ฉฐ, LEAP [140]์ ์ค์, ์ ์์ค ์์น, ๊ณ ์์ค ์์น์ ์์ฑํด ์ด๋ฅผ ํ๋กฌํํธ์ ํตํฉํ์ฌ ์ต์ข ์ถ๋ก ์ ํ์ฉํฉ๋๋ค. RICP [141]๋ ํ์ต ๋ฐ์ดํฐ์ ์ค์๋ฅผ ํ์ฉํ์ฌ ๊ณ ์์ค ์ถ๋ก ๋ฐ ๊ตฌ์ฒด์ ์ธ ํต์ฐฐ์ ์์ฑํ ๋ค์, ๊ณ์ธต์ ํด๋ฌ์คํฐ๋ง์ ์ฌ์ฉํด ์ค๋ฅ ์ ํ์ ๊ทธ๋ฃนํํฉ๋๋ค. ์ด๋ฅผ ํตํด ์์ ์์ค๊ณผ ์ง๋ฌธ ์์ค์ ์์น์ ์์ฑํ๊ณ , ์ด๋ฅผ ๊ฒฐํฉํด ์ง๋ฌธ ์์ค์ ํต์ฐฐ์ ์ ๊ณตํฉ๋๋ค. Buffer-of-Thought [142]๋ ๋ฌธ์ ๋ฅผ ์์ฝ(distill)ํ์ฌ ์ฌ๋ฌ ์ถ๋ก ์์ ์ ํตํฉํ๋ ๋ฉํ ๋ฒํผ(meta-buffer)๋ฅผ ์์ฑํฉ๋๋ค.
ํตํฉ๋ ๋ฐฉ๋ฒ ์ค ํ๋์ธ MedPrompt [143]๋ GPT-4๊ฐ ์์ฑํ ์ถ๋ก ์ฒด์ธ์ ํ์ต ์์ ๋ก ํ์ฉํ๊ณ , ์ด๋ฅผ KNN ๊ธฐ๋ฐ ์ธ์ปจํ ์คํธ ํ์ต ์ ๊ทผ๋ฒ๊ณผ ๊ฒฐํฉํฉ๋๋ค. Agent Hospital [144]์ ๋ฐ์ฑ(reflection)์ ํตํด ๋ ผ๊ฑฐ๋ฅผ ์์ฑํ๋ฉฐ, ์์ฑ๋ ๋ฐ์ดํฐ์์ ๊ธฐ๋ก ๊ฒ์๊ณผ ๊ฒฝํ ๊ฒ์์ ํ์ฉํฉ๋๋ค.
์ด๋ฌํ ๊ฐ๋ ๋ค์ ๊ฐ์ด๋๋ผ์ธ, ์์น, ๊ฒฝํ, ์ฌ๊ณ ํ ํ๋ฆฟ ๋ฑ ๋ค์ํ ์ด๋ฆ์ผ๋ก ๋ถ๋ฆฌ์ง๋ง, ํต์ฌ ์์ด๋์ด๋ ๊ณตํต์ ์ผ๋ก ์ ์ฉํ ๋ ผ๊ฑฐ๋ฅผ ์ถ์ถํ์ฌ ์ถ๋ก ์ง์๋ฅผ ๊ฐํํ๋ ๊ฒ์ ๋๋ค. ์ด๋ฌํ ๋ ผ๊ฑฐ๋ ์์ฒด ์์ฑ๋ ์ฌ๊ณ ์ฒด์ธ(MedPrompt, Buffer-of-Thought), ํ์ต ์ธํธ์ ์ค์(GL, RICP, Agent Hospital), ๋๋ ์๋์ ์ผ๋ก ์์ฑ๋ ์ค์(LEAP)์์ ๋น๋กฏ๋ ์ ์์ต๋๋ค.
๋ํ, ์ผ๋ถ ์์น์ ๋ชจ๋ ์์ ์ ๊ฑธ์ณ ์ฌ์ฉ(Agent Hospital, RICP)๋๋ ๋ฐ๋ฉด, ๋ค๋ฅธ ์์น์ ํน์ ์ง๋ฌธ์ ๋ง๊ฒ ๋์ ์ผ๋ก ๊ฒ์(MedPrompt, Buffer-of-Thought)๋ฉ๋๋ค. ๋ง์ ์ฐ๊ตฌ๋ ์ฌ๋ก์์ ํ์ตํ๊ณ ๊ฒฝํ์ ๋ ผ๊ฑฐ๋ก ์ถ์ ํ๋ ๊ฒ์ด ๋ค์ํ ์ถ๋ก ์์ ์ ์ ์ตํ๋ค๋ ์ ์ ์ ์ฆํ๊ณ ์์ต๋๋ค.
6.4 In-Context Learning (ICL)
์ปจํ ์คํธ ํ์ต์์ ์์ ๋ฅผ ํ์ฉํ๋ ๊ฒ์ ์จ๊ฒจ์ง ๋ ผ๊ฑฐ๋ฅผ ํ๊ตฌํ๋ ์ผ๋ฐ์ ์ธ ๋ฐฉ๋ฒ์ ๋๋ค. ์ฌ์ ํ์ต๋ ๋ํ ์ธ์ด ๋ชจ๋ธ(LLM)์ ๊ฐ๋ ฅํ ์ธ์ปจํ ์คํธ ํ์ต(In-Context Learning, ICL) ๋ฅ๋ ฅ์ ๋ณด์ด๋ฉฐ, ์ ์ฌ์ฑ์ ๊ธฐ๋ฐ์ผ๋ก ์์ ๋ฅผ ๊ฒ์ํ์ฌ ๋ชจ๋ธ์ ์์ ์ํ ํ์ต(few-shot learning) ๋ฅ๋ ฅ์ ๊ฐํํ ์ ์์ต๋๋ค [145, 146]. ๊ทธ๋ฌ๋ ํ๋กฌํํธ์ ๊ด๋ จ ์๋ ์ ๋ณด๊ฐ ํฌํจ๋ ๊ฒฝ์ฐ, LLM์ด ์ฝ๊ฒ ํผ๋์ ๊ฒช์ด ๋ถ์ ํํ ์๋ต์ ์์ฑํ ์ ์์ต๋๋ค [147, 148]. Wu et al. [149]์ด ๊ฐ๋ฐํ OpenICL์ ๋ค์ํ ์ ํต์ ์ธ ์์ ๊ฒ์ ๋ฐ ์ถ๋ก ๊ธฐ๋ฒ์ด ์ธ์ปจํ ์คํธ ํ์ต์ ํจ๊ณผ์ ๋ฏธ์น๋ ์ํฅ์ ํ๊ตฌํ๋ ICL ํ๋ ์์ํฌ๋ฅผ ๊ตฌ์ฑํ์ต๋๋ค.
LLM์์ ์ ๊ณตํ๋ ํผ๋๋ฐฑ์ ๋ฐํ์ผ๋ก ์๊ท๋ชจ ๋ชจ๋ธ์ ํ๋ จํ์ฌ ์ปจํ ์คํธ ์์ ๋ฅผ ์ ํํ๊ณ , ํน์ ์์ ์ ๋ง๋ ์ต์ ์ ์์ ์ ๋ฐ๋ชจ๋ฅผ ๊ตฌ์ฑํ ์ ์์ต๋๋ค [150, 5, 151]. ๋ํ, Su et al. [152]๋ ์ค์ง์ ์ธ ํ ์คํธ์ ํ์ํ ๋ ๋์ ์ฐ๊ด์ฑ์ ํฌ๊ดํ์ง ๋ชปํ๋ ์๋ฏธ์ ์ ์ฌ์ฑ ๊ธฐ๋ฐ ์์ ๊ฒ์์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด vote-k๋ผ๋ ๋น์ง๋ ํ์ต ๊ธฐ๋ฐ ๊ทธ๋ํ ์ ํ ์ฃผ์ ๋ฐฉ๋ฒ์ ์ฌ์ฉํ์ต๋๋ค. ์ด๋ฅผ ํตํด ๋ ๋ค์ํ๊ณ ๋ํ์ ์ธ ์์ ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ฅผ ๊ตฌ์ถํ์ฌ ์์ ์ํ ํ์ต์ ์ง์ํ์ต๋๋ค. Zhang et al. [153]์ ๋ค์ํ ๋ํ ์ ํ์ผ๋ก ์์ ๋ฅผ ํด๋ฌ์คํฐ๋งํ๋ Auto-CoT ๋ฐฉ๋ฒ์ ์ ์ํ์ต๋๋ค. ์ด ๋ฐฉ๋ฒ์ ๋ฌธ์ ๋ฅผ ๋ค์ํ๊ฒ ์ํ๋งํ๊ณ ์ถ๋ก ์ฒด์ธ์ ์์ฑํ์ฌ ํ์ต ๊ณผ์ ์ ๋ ํจ๊ณผ์ ์ผ๋ก ์ง์ํ๋ ์์ ๋ฅผ ๊ตฌ์ฑํฉ๋๋ค.
LLM์ด ํ๋ จ๋ ๋๋ฉ์ธ ์ธ๋ถ์์ ์์ ์ํ ํ์ต์ ํตํด ์ถ๋ก ๋ฅ๋ ฅ์ ์ตํ๋ ๊ฒ์ ์ฌ์ ํ ํฐ ๋์ ๊ณผ์ ์ ๋๋ค. **Wang et al.**์ ๋ค์ํ ์ถ๋ก ๊ฒฝ๋ก๋ฅผ ์ํ๋งํ๊ณ , ์ด๋ฅผ ํตํด ๊ฐ์ฅ ์ผ๊ด๋ ๋ต๋ณ์ ์ ํํจ์ผ๋ก์จ LLM์ด ์ฌ๋ฐ๋ฅธ ์ถ๋ก ์ฒด์ธ์ ์ ํํ ํ๋ฅ ์ ๋์ด๋ ๋ฐฉ์์ ์ ์ํ์ต๋๋ค [154]. **Agarwal et al.**์ ์ฌ์ฉ ๊ฐ๋ฅํ ์์ ๋ฅผ ์์ฑํ๊ธฐ ์ํ ๋ ๊ฐ์ง ํ์ฅ ๊ฐ๋ฅํ ๋ฐฉ๋ฒ(๊ฐํ ICL ๋ฐ ๋น์ง๋ ICL)์ ์๊ฐํ์ฌ, ์ฌ๋์ด ์์ฑํ ์์ ๋ฅผ ๋์ฒดํ๊ณ ์์ ํ์ด ํ์ฅ๋ ์ ์๋๋ก ํ์ต๋๋ค [155].
DIN-SQL [156]์ ์์ ์ ๋ ๋จ์ํ ํ์ ์์ ์ผ๋ก ๋ถํดํ๊ณ , ์ด ํ์ ๋ฌธ์ ์ ์๋ฃจ์ ์ LLM์ ํ๋กฌํํธ๋ก ์ฌ์ฉํ์ฌ ํ ์คํธ์์ SQL์ ์์ฑํ๋ ์ฑ๋ฅ์ ํฌ๊ฒ ํฅ์์์ผฐ์ต๋๋ค. ๋น์ทํ๊ฒ, DUP [157]๋ LLM์ด ์ฒด์ธ ์ค๋ธ ์ฌ๊ณ (CoT)๋ฅผ ์ฌ์ฉํ์ฌ ๋ณต์กํ ์ํ์ ๋จ์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ๋ ์ง๋ฉดํ๋ ์ฃผ์ ์ธ ๊ฐ์ง ๋ฌธ์ (์๋ฏธ์ ์คํด, ๊ณ์ฐ ์ค๋ฅ, ๋๋ฝ๋ ๋จ๊ณ)๋ฅผ ํ์ธํ์ต๋๋ค. ์ฌ๊ธฐ์ ์๋ฏธ์ ์คํด๊ฐ ์ฃผ์ ์ ํ ์์ธ์ผ๋ก ์ง์ ๋์์ผ๋ฉฐ, ๋ฌธ์ ๋ฅผ ๊น์ด ์ดํดํ๊ณ ํด๊ฒฐ์ ํ์ํ ํต์ฌ ์ ๋ณด๋ฅผ ์ถ์ถํ๋๋ก LLM์ ์ ๋ํจ์ผ๋ก์จ ์ํ ๋ฌธ์ ํด๊ฒฐ ๋ฅ๋ ฅ์ ํฌ๊ฒ ํฅ์์ํฌ ์ ์๋ค๊ณ ์ค๋ช ํ์ต๋๋ค.
6.5 Fine Tuning
LLM(๋ํ ์ธ์ด ๋ชจ๋ธ)์ ๊ฐ๋ ฅํ In-Context ํ์ต ๋ฅ๋ ฅ์๋ ๋ถ๊ตฌํ๊ณ , ๋ณต์กํ๊ณ ๊ธด ๋ ผ๋ฆฌ ์ฒด์ธ์ ์ํ ์ต์ ์ ๋ ผ๊ฑฐ๋ ์์ ๋ฅผ ์ ํํ ์๋ณํ๋ ๊ฒ์ ์ฌ์ ํ ์ค์ํ ๋์ ๊ณผ์ ๋ก ๋จ์ ์์ต๋๋ค. ๋ํ, ๋ฐฉ๋ํ ์ธ๋ถ ์ฌ์ ์ง์์ ์ ๊ณตํ๋ ๊ณผ์ ์์ LLM์ ์ถ๋ก ๋ฅ๋ ฅ์ด ์ ํ๋ ์ ์๋ ๋ฌธ์ ๊ฐ ๋ฐ์ํ ์ ์์ต๋๋ค. ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ๊ณ ๋ คํ ๋, **ํ์ธํ๋(fine-tuning)**์ ์ ๋งํ ์ ๊ทผ๋ฒ์ผ๋ก ๋ถ๊ฐ๋ฉ๋๋ค. ํ์ธํ๋์ LLM์ด ์ฌ์ ํ์ต(pre-training) ๋์ ํ๋ํ ๊ด๋ฒ์ํ ๊ธฐ์ด ์ง์์ ํ์ฉํ ๋ฟ๋ง ์๋๋ผ, ์๋ก์ด ๋๋ฉ์ธ์ ๋ ผ๊ฑฐ๋ฅผ ๋น ๋ฅด๊ฒ ์ต๋ํ ์ ์๋๋ก ์ง์ํฉ๋๋ค. ์ด๋ฅผ ํตํด LLM์ด ๊ณ ๊ธ ๋ฐ ํนํ๋ ์์ ์ ์ฒ๋ฆฌํ๋ ๋ฐ ํ์ํ ์ ์์ฑ๊ณผ ํจ๊ณผ์ฑ์ ํฅ์์ํฌ ์ ์๋ ์ค์ง์ ์ธ ๋ฐฉ์์ ์ ๊ณตํฉ๋๋ค.
Instruction Tuning : ์ธ์คํธ๋ญ์ ํ๋์ LLM์ ์๋ก์ด ๊ธฐ๋ฅ์ ์ฃผ์ ํ๋ ์ผ๋ฐ์ ์ธ ๋ฐฉ๋ฒ์ผ๋ก, ์ฃผ๋ก (์ง์๋ฌธ, ์ถ๋ ฅ) ์ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ ์ง๋ํ์ต ๊ธฐ๋ฐ์ ํ์ธํ๋์ ํฌํจํฉ๋๋ค. ์ธ์คํธ๋ญ์ ๋ฐ์ดํฐ์ ์ ๊ตฌ์ฑํ๋ ์ฃผ์ ๋ฐฉ๋ฒ์ ๋ค์ ์ธ ๊ฐ์ง์ ๋๋ค:
a) ๊ธฐ์กด ๋ฐ์ดํฐ์ ์์ ์ถ์ถ [161, 162]
b) ์์์ ์ผ๋ก ์ง์๋ฌธ์ ์ ์ [163, 164, 165]
c) ๊ฐ๋ ฅํ LLM์ ์ฌ์ฉํ์ฌ ํฉ์ฑ ๋ฐ์ดํฐ๋ฅผ ์์ฑ [166, 154]
๋ํ, ์ฌ๋ฌ ์ฐ๊ตฌ [167, 168, 169]๋ ์ธ์คํธ๋ญ์ ๋ฐ์ดํฐ์ ๋ด ๋ฐ์ดํฐ ๋ถํฌ๋ฅผ ์ต์ ํํ์ฌ ํ์ธํ๋์ ํจ๊ณผ๋ฅผ ๋์ด๋ ๋ฐฉ๋ฒ์ ํ๊ตฌํ์ต๋๋ค. ํ์ง๋ง, ๋ฐ์ดํฐ ์ฆ๊ฐ ๊ธฐ๋ฐ LLM ์ ํ๋ฆฌ์ผ์ด์ ์ ๊ตฌ์ถํ ๋, ํ์ธํ๋์ ์ฌ์ ํ ์๊ฐ ๋ฐ ๊ณ์ฐ ์์ ์ธก๋ฉด์์ ๋น๊ต์ ๋น์ฉ์ด ๋ง์ด ๋๋ ๋ฐฉ๋ฒ์ผ๋ก ๊ฐ์ฃผ๋ฉ๋๋ค.
ํ์ธํ๋ ๋น์ฉ ์ ๊ฐ ๋ฐฉ์ : ์ต๊ทผ์๋ ๋ํ ๋ชจ๋ธ์ ํ์ธํ๋ ๋น์ฉ์ ์ค์ด๊ธฐ ์ํ ์ฌ๋ฌ ๋ ธ๋ ฅ์ด ์ด๋ฃจ์ด์ก์ต๋๋ค. ๋ํ์ ์ธ ๋ฐฉ๋ฒ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
์ด๋ํฐ ํ๋(Adapter Tuning) : LLM์ ๋งค๊ฐ๋ณ์๋ฅผ ๊ณ ์ (freezing)ํ ์ํ์์ ์๊ท๋ชจ ์ด๋ํฐ ๋ชจ๋ธ์ ํตํฉํ๊ณ , ํ์ธํ๋ ์ ์ด๋ํฐ์ ๊ฐ์ค์น๋ง ์ต์ ํํ๋ ๋ฐฉ๋ฒ์ ๋๋ค [170, 171, 172, 173].
ํ๋ฆฌํฝ์ค ํ๋(Prefix Tuning) ๋ฐ ํ๋กฌํํธ ํ๋(Prompt Tuning) : ์ ๋ ฅ ์์ ํ์ต ๊ฐ๋ฅํ ๋ฒกํฐ ์งํฉ์ ์ถ๊ฐํ๊ณ , ์ด๋ฅผ ํ๋ จ ์ค์ ์ต์ ํํ์ฌ LLM์ ์ฑ๋ฅ์ ํฅ์์ํค๋ ๋ฐฉ๋ฒ์ ๋๋ค [174, 175, 176, 177, 178].
์ ๋ญํฌ ์ ์(Low-Rank Adaptation, LoRA) : ๊ฐ ๋ฐ์ง ๊ณ์ธต(dense layer)์ ์ ๋ญํฌ ์ ์ฝ์ ๊ฐํด ์ ๋ฐ์ดํธ ํ๋ ฌ์ ๊ทผ์ฌํจ์ผ๋ก์จ, ํ์ ์์ ์ ์ ์ํ๋ ๋ฐ ํ์ํ ํ์ต ๊ฐ๋ฅํ ๋งค๊ฐ๋ณ์ ์๋ฅผ ์ค์ด๋ ๋ฐฉ๋ฒ์ ๋๋ค [179, 180, 181, 182, 183].
์ต๊ทผ ๋ช ๋ ๊ฐ, supervised fine-tuning์ ํ์ฉํ์ฌ LLM(๋ํ ์ธ์ด ๋ชจ๋ธ)์ ํนํ๋ ๋๋ฉ์ธ ๋ฅ๋ ฅ์ ๊ฐํํ๋ ์ฐ๊ตฌ๊ฐ ํ๋ฐํ ์ด๋ฃจ์ด์ก์ต๋๋ค. ์ด๋ ์ํ์ ์ถ๋ก , ๊ธ์ต, ๋ฒ๋ฅ , ์๋ฃ์ ๊ฐ์ ์ ๋ฌธ ๋ถ์ผ์์ ๋๋๋ฌ์ง ์ฑ๊ณผ๋ฅผ ๋ณด์ด๊ณ ์์ต๋๋ค [184, 185, 186]. ์๋ฅผ ๋ค์ด: ChatTimeLlama [187]๋ ํด์ ๊ฐ๋ฅํ ์๊ฐ ์ถ๋ก ์ง์๋ฌธ ํ๋ ๋ฐ์ดํฐ์ ์ ๋์ ํ๊ณ , LLaMA [188]์ ํ์ธํ๋์ ์ ์ฉํ์ฌ ๋ชจ๋ธ์ ๋ณต์กํ ์๊ฐ์ ์ถ๋ก , ๋ฏธ๋ ์ฌ๊ฑด ์์ธก ๋ฅ๋ ฅ ๋ฐ ํด์ ๊ฐ๋ฅ์ฑ์ ํฌ๊ฒ ํฅ์์์ผฐ์ต๋๋ค. LISA [189]๋ ์๊ท๋ชจ ์ถ๋ก ๊ด๋ จ ์ธ๊ทธ๋จผํธ ๋ฐ์ดํฐ ์ํ์ ํ์ฉํด ๋ฉํฐ๋ชจ๋ฌ LLM์ธ LLaVA๋ฅผ ํ์ธํ๋ํ์ฌ ์ถ๋ก ์ธ๊ทธ๋จผํธ ๋ฅ๋ ฅ์ ํฌ๊ฒ ๊ฐ์ ํ์ต๋๋ค. MAmmoTH [190]๋ Chain of Thought(CoT)์ Program of Thought ์ถ๋ก ์ ๋ ์ฐฝ์ ์ผ๋ก ๊ฒฐํฉํ ์ํ ์์ ๋ฐ์ดํฐ์ ์ ๊ตฌ์ถํด, ๋ค์ํ ์ํ์ ๋๋ฉ์ธ์ ํฌ๊ดํ๊ณ ์ผ๋ฐ์ ์ธ ์ํ ๋ฌธ์ ํด๊ฒฐ ๋ฅ๋ ฅ์ ํฅ์์์ผฐ์ต๋๋ค. ReFT [191]๋ ๋์ผํ ๋ฌธ์ ์ ๋ํ ์ฌ๋ฌ ์ฃผ์๋ ์ถ๋ก ๊ฒฝ๋ก๋ฅผ ํ์ตํ๋ ๋ฐฉ๋ฒ์ ์ ์ํ์ต๋๋ค. ์ด ๋ฐฉ๋ฒ์ ์ํ ๋ฌธ์ ์ ๋ํด ๋ค์ํ ์ถ๋ก ๊ฒฝ๋ก๋ฅผ ์๋์ผ๋ก ์ํ๋งํ๊ณ , ์ ๋ต์ ํ์ฉํด ๋ณด์ ์ ํธ๋ฅผ ์์ฑํฉ๋๋ค. ChatDoctor [192]๋ ๋๋ฆฌ ์ฌ์ฉ๋๋ ์จ๋ผ์ธ ์๋ฃ ์๋ด ํ๋ซํผ์์ ์์งํ 10๋ง ๊ฐ์ ํ์-์์ฌ ๋ํ ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํด LLaMA๋ฅผ ํ์ธํ๋ํ์ฌ, ํ์์ ์๊ตฌ๋ฅผ ์ดํดํ๊ณ ํจ๊ณผ์ ์ธ ๊ถ์ฅ ์ฌํญ์ ์ ๊ณตํ๋ ๋ฅ๋ ฅ์ ํฌ๊ฒ ๊ฐํํ์ต๋๋ค. FinGPT [193]๋ ๊ธ์ต ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์คํ์์ค LLM์ ๊ฐ๋ฐํ์ผ๋ฉฐ, ์๋ ๋ฐ์ดํฐ ํ๋ ์ด์ ๊ณผ ๊ฒฝ๋ํ๋ ์ ๋ญํฌ ์ ์ ๊ธฐ๋ฒ์ ํ์ฉํ์ฌ ํ์ธํ๋ํ์ต๋๋ค. DISC-LawLLM [194]์ ์ค๊ตญ ์ฌ๋ฒ ๋๋ฉ์ธ์ ์ํ ์ง๋ ํ์ต ํ์ธํ๋ ๋ฐ์ดํฐ์ ์ ๊ตฌ์ถํ์ฌ, ๋ค์ํ ๋ฒ๋ฅ ์๋๋ฆฌ์ค์์ ์ฌ์ฉ์๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ง์ํ ์ ์๋๋ก LLM์ ํ์ธํ๋ํ์ต๋๋ค. ์ด ๊ณผ์ ์์ ๋ฒ๋ฅ ์ถ๋ก ๋ฅ๋ ฅ์ด ํฌ๊ฒ ํฅ์๋์์ต๋๋ค. ์ด์ ๊ฐ์ ์ฐ๊ตฌ๋ค์ LLM์ด ํน์ ๋๋ฉ์ธ์ ์๊ตฌ์ฌํญ์ ๋ง์ถฐ ๊ณ ๊ธ ์ถ๋ก ๋ฅ๋ ฅ์ ๊ฐ์ถ๋๋ก ํ๋ ๋ฐ ์ค์ํ ๊ธฐ์ฌ๋ฅผ ํ๊ณ ์์ต๋๋ค.
7. Conclusion
์ด ๋ ผ๋ฌธ์์๋ ์ง์์ ์ฃผ์ ์ด์ ์ ๊ธฐ์ค์ผ๋ก ๋ฐ์ดํฐ ์ฆ๊ฐ LLM ์ ํ๋ฆฌ์ผ์ด์ ์ ๋ค ๊ฐ์ง ๋ฒ์ฃผ๋ก ๊ตฌ๋ถํ๋ฉฐ, ๊ฐ ๋ฒ์ฃผ๋ ๊ณ ์ ํ ๋์ ๊ณผ์ ์ ์ง๋ฉดํ๊ณ ์์ด ์ด์ ๋ง๋ ๋ง์ถคํ ์๋ฃจ์ ์ด ํ์ํจ์ ์ค๋ช ํฉ๋๋ค. Figure 05์ ์ด๋ฅผ ๋ํ๋ด์์ต๋๋ค. ์ ์ ์์ ์ง์์ ๊ด๋ จ๋ ์ง์ : ์ผ๋ฐ์ ์ธ LLM์ Chain of Thought(CoT) ๋ฐฉ๋ฒ๋ก ์ ํตํด ๋ฐฐ์นํ๋ ๊ฒ์ด ํจ๊ณผ์ ์ ๋๋ค. ๋ช ์์ ์ฌ์ค ์ง์ : ์ฃผ์ ๋์ ๊ณผ์ ๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค ๋ด์์ ์ ํํ ์ฌ์ค์ ์์น๋ฅผ ์ฐพ์๋ด๋ ๊ฒ์ด๋ฉฐ, ์ด์ ๋ฐ๋ผ ๊ธฐ๋ณธ์ ์ธ RAG(Retrieval-Augmented Generation)๊ฐ ์ต์ ์ ๋ฐฉ๋ฒ์ผ๋ก ์ฌ์ฉ๋ฉ๋๋ค. ์์์ ์ฌ์ค ์ง์ : ๋ค์์ ๊ด๋ จ๋ ์ฌ์ค์ ์ข ํฉํด์ผ ํ๋ ์ด ์ ํ์ ์ง์์์๋ ๋ฐ๋ณต์ ์ธ RAG ๋ฐ ๊ทธ๋ํ๋ ํธ๋ฆฌ ๊ตฌ์กฐ์ ๊ธฐ๋ฐํ RAG ๊ตฌํ์ด ์ ํธ๋ฉ๋๋ค. ์ด๋ฌํ ๋ฐฉ์์ ๊ฐ๋ณ ์ฌ์ค์ ๊ฒ์ํ๊ณ ๋ค์์ ๋ฐ์ดํฐ ํฌ์ธํธ๋ฅผ ์ํธ ์ฐ๊ฒฐํ๋ ๋ฅ๋ ฅ์ ์ ๊ณตํฉ๋๋ค. ๋ํ, ๋ฐฉ๋ํ ๋ฐ์ดํฐ ์ฐ๊ฒฐ์ด ํ์ํ ๊ฒฝ์ฐ text-to-SQL ๊ธฐ์ ์ ํ์ฉํ์ฌ ๋ฐ์ดํฐ๋ฒ ์ด์ค ๋๊ตฌ๋ฅผ ํตํด ์ธ๋ถ ๋ฐ์ดํฐ๋ฅผ ๊ฒ์ํ๋ ๊ฒ์ด ํ์์ ์ ๋๋ค. ํด์ ๊ฐ๋ฅํ ๋ ผ๊ฑฐ ์ง์ : ์ธ๋ถ ์ง์นจ์ ๋ํ LLM์ ์ค์ ๋ฅ๋ ฅ์ ํฅ์์ํค๊ธฐ ์ํด ํ๋กฌํํธ ํ๋(prompt tuning) ๋ฐ CoT ํ๋กฌํํ ์ด ์ค์ํ ์ญํ ์ ํฉ๋๋ค. ์จ๊ฒจ์ง ๋ ผ๊ฑฐ ์ง์ : ๊ฐ์ฅ ์ด๋ ค์ด ์ ํ์ผ๋ก, ๋ฐฉ๋ํ ๋ฐ์ดํฐ ์ธํธ์์ ๋ฌธ์ ํด๊ฒฐ ์ ๊ทผ ๋ฐฉ์์ ์์จ์ ์ผ๋ก ์ข ํฉํด์ผ ํฉ๋๋ค. ์ด ๊ฒฝ์ฐ ์คํ๋ผ์ธ ํ์ต, ์ธ์ปจํ ์คํธ ํ์ต, ํ์ธํ๋์ด ํต์ฌ ๋ฐฉ๋ฒ๋ก ์ผ๋ก ํ์ฉ๋ฉ๋๋ค.
ํน์ LLM ์ ํ๋ฆฌ์ผ์ด์ ์ ๊ฐ๋ฐํ๊ธฐ ์ ์, ๋๋ฉ์ธ ์ ๋ฌธ๊ฐ๋ก์ ์ฐ๋ฆฌ๋ ๋ชฉํ ์์ ์ ๋ํ ๊น์ ์ดํด๋ฅผ ๋ฐํ์ผ๋ก ์ง์์ ๋ณต์ก์ฑ ์์ค์ ํ์ ํ๊ณ , ์ ํฉํ ๊ธฐ์ ์ ์ ๊ทผ๋ฒ์ ์ ํํด์ผ ํฉ๋๋ค. ์ด๋ฌํ ์ ๊ทผ๋ฒ์ Figure 06์ ์ ์๋ ์ธ ๊ฐ์ง ์ฃผ์ ๋ฉ์ปค๋์ฆ์ ํตํด LLM์ ์ง์์ ์ฃผ์ ํฉ๋๋ค: ์ง์๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋๋ฉ์ธ ๋ฐ์ดํฐ์ ์ผ๋ถ๋ฅผ ์ถ์ถํ์ฌ LLM์ ์ปจํ ์คํธ ์ ๋ ฅ์ผ๋ก ์ ๊ณต, ํน์ ๋๋ฉ์ธ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํด ์๊ท๋ชจ ๋ชจ๋ธ์ ํ๋ จํ ๋ค, ์ด๋ฅผ ํตํด ์ธ๋ถ ์ ๋ณด๋ฅผ LLM์ ํตํฉ, ์ธ๋ถ ๋๋ฉ์ธ ์ง์์ ์ฌ์ฉํด ์ผ๋ฐ์ ์ธ LLM์ ๋๋ฉ์ธ ์ ๋ฌธ ๋ชจ๋ธ๋ก ํ์ธํ๋ ์ด๋ค ์ ๋ต์ ์๊ตฌ๋๋ ๋ฐ์ดํฐ ์, ํ๋ จ ์๊ฐ, ๊ณ์ฐ ์์ ์ธก๋ฉด์์ ๊ฐ๊ฐ ๋ค๋ฅธ ์๊ตฌ ์ฌํญ์ ๊ฐ์ง๋ฉฐ, ๋ณต์ก๋๊ฐ ์ ์ง์ ์ผ๋ก ์ฆ๊ฐํฉ๋๋ค. ์ปจํ ์คํธ๋ฅผ ํตํ ์ง์ ์ฃผ์ : ์ด ๋ฐฉ๋ฒ์ ๋ ๋์ ํด์ ๊ฐ๋ฅ์ฑ๊ณผ ์์ ์ฑ์ ์ ๊ณตํ์ง๋ง, ์ ํํ ์ปจํ ์คํธ ์๋์ฐ์ ์ค๊ฐ ์ ๋ณด ์์ค ๊ฐ๋ฅ์ฑ์ผ๋ก ์ธํด ํ๊ณ๊ฐ ์์ต๋๋ค [40]. ๋ฐ๋ผ์ ์งง์ ํ ์คํธ๋ก ๋ฐ์ดํฐ๋ฅผ ๊ฐ๊ฒฐํ๊ฒ ์ค๋ช ํ ์ ์๋ ์๋๋ฆฌ์ค์ ์ ํฉํฉ๋๋ค. ๊ทธ๋ฌ๋ ์ด ๋ฐฉ์์ ๋ชจ๋ธ์ ๊ฒ์ ๋ฅ๋ ฅ๊ณผ ์ง์ ์ถ์ถ ๋ฅ๋ ฅ์ ๋์ ๊ณผ์ ๋ฅผ ์ ๊ธฐํฉ๋๋ค. ์๊ท๋ชจ ๋ชจ๋ธ ์ ๊ทผ๋ฒ : ์ด ๋ฐฉ์์ ํ๋ จ ์๊ฐ์ ์ค์ด๊ณ ์๋นํ ์์ ๋ฐ์ดํฐ๋ฅผ ํตํฉํ ์ ์๋ ์ฅ์ ์ ์ ๊ณตํฉ๋๋ค. ๊ทธ๋ฌ๋ ์๊ท๋ชจ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๋ฐ๋ผ LLM์ ๋ณต์กํ ์์ ์ํ ๋ฅ๋ ฅ์ด ์ ํ๋ ์ ์์ผ๋ฉฐ, ๋ฐ์ดํฐ๊ฐ ์ฆ๊ฐํจ์ ๋ฐ๋ผ ์ถ๊ฐ์ ์ธ ํ๋ จ ๋น์ฉ์ด ๋ฐ์ํ ์ ์์ต๋๋ค. ํ์ธํ๋ : ๋ฐฉ๋ํ ๋๋ฉ์ธ ํนํ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํด ๋ํ ๋ชจ๋ธ์ ์ญ๋์ ์ต๋ํํ ์ ์์ต๋๋ค. ๊ทธ๋ฌ๋ LLM์ ์ฑ๋ฅ์ ๋ํ ํ์ธํ๋์ ์ํฅ์ ์ฌ์ฉ๋ ๋ฐ์ดํฐ ์ค๊ณ์ ํฌ๊ฒ ์์กดํฉ๋๋ค. ๋๋ฉ์ธ ์ธ๋ถ์ ์ฌ์ค ๋ฐ์ดํฐ๋ฅผ ํ์ธํ๋์ ์ฌ์ฉํ๋ฉด LLM์ด ๋ ๋ง์ ์ค๋ฅ๋ฅผ ์์ฑํ ๊ฐ๋ฅ์ฑ์ด ์์ผ๋ฉฐ, ๊ธฐ์กด์ ๋๋ฉ์ธ ์ง์์ ์๊ฑฐ๋ ํ์ธํ๋ ๋์ ๋ค๋ฃจ์ง ์์ ์์ ์ ์ํํ ํ ์ํ์ด ์์ต๋๋ค [110, 195].
๋ฐ๋ผ์, LLM์ ์ ํฉํ ๋ฐ์ดํฐ ์ฃผ์ ์ ๋ต์ ์ ํํ๋ ค๋ฉด ๋ฐ์ดํฐ ์์ค์ ๋ํ ์ฒ ์ ํ ์ดํด์ ์ด๋ฅผ ๋ฐํ์ผ๋ก ์ ์คํ ์์ฌ๊ฒฐ์ ์ด ํ์ํฉ๋๋ค. ๋ํ, ์ค์ง์ ์ธ ์ํฉ์์๋ ๋ฐ์ดํฐ ์ฆ๊ฐ ๊ธฐ๋ฐ LLM ์ ํ๋ฆฌ์ผ์ด์ ์ด ๋ค์ํ ์ ํ์ ์ง์๋ฅผ ํฌํจํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์, ๊ฐ๋ฐ์๋ ์ด๋ฌํ ๋ณต์กํ ๋ฌธ์ ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํด๊ฒฐํ๊ธฐ ์ํด ์ฌ๋ฌ ๋ฐฉ๋ฒ๋ก ์ ํตํฉํ ๋ผ์ฐํ ํ์ดํ๋ผ์ธ์ ์ค๊ณํด์ผ ํฉ๋๋ค.
Last updated