[2024] Retrieval Augmented Generation (RAG) and Beyond

2024.12.21.

ABSTRACT

์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•œ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์€ ์‹ค์ œ ๊ณผ์ œ๋ฅผ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ฐ ์žˆ์–ด ๋›ฐ์–ด๋‚œ ๋Šฅ๋ ฅ์„ ๋ณด์—ฌ์ฃผ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๋Š” ๋ชจ๋ธ์˜ ํŠน์ • ๋„๋ฉ”์ธ ์ „๋ฌธ์„ฑ๊ณผ ์‹œ์˜์„ฑ(= ์‹œ๊ฐ„์  ์‹œ์ ์— ๋Œ€ํ•œ ๊ด€๋ จ์„ฑ)์„ ๊ฐ•ํ™”ํ•  ๋ฟ ์•„๋‹ˆ๋ผ ํ™˜๊ฐ(hallucination) ๋ฐœ์ƒ์„ ์ค„์—ฌ ๊ฒฐ๊ณผ๋ฌผ์˜ ์ œ์–ด ๊ฐ€๋Šฅ์„ฑ๊ณผ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ์„ ๋†’์ด๋Š” ๋ฐ ๊ธฐ์—ฌํ•ฉ๋‹ˆ๋‹ค. ๊ฒ€์ƒ‰ ๊ธฐ๋ฐ˜ ์ƒ์„ฑ (RAG, Retrieval-Augmented Generation) ๋ฐ ํŒŒ์ธํŠœ๋‹๊ณผ ๊ฐ™์€ ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๋ฅผ LLM์— ํ†ตํ•ฉํ•˜๋Š” ๊ธฐ์ˆ ์€ ์ ์  ๋” ์ฃผ๋ชฉ๋ฐ›๊ณ  ์žˆ์œผ๋ฉฐ, ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์—์„œ ๋„๋ฆฌ ์‘์šฉ๋˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿผ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ , ๋ฐ์ดํ„ฐ๋กœ ๊ฐ•ํ™”๋œ LLM์„ ๋‹ค์–‘ํ•œ ์ „๋ฌธ ๋ถ„์•ผ์— ํšจ๊ณผ์ ์œผ๋กœ ๋ฐฐ์น˜ํ•˜๋Š” ๊ฒƒ์€ ์—ฌ์ „ํžˆ ํฐ ๋„์ „ ๊ณผ์ œ๋กœ ๋‚จ์•„ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋„์ „ ๊ณผ์ œ๋Š” ๊ด€๋ จ ๋ฐ์ดํ„ฐ ๊ฒ€์ƒ‰ ๋ฐ ์‚ฌ์šฉ์ž ์˜๋„ ํ•ด์„์—์„œ๋ถ€ํ„ฐ ๋ณต์žกํ•œ ๊ณผ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ LLM์˜ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ์˜จ์ „ํžˆ ํ™œ์šฉํ•˜๋Š” ๊ฒƒ์— ์ด๋ฅด๊ธฐ๊นŒ์ง€ ๊ด‘๋ฒ”์œ„ํ•œ ์˜์—ญ์— ๊ฑธ์ณ ์žˆ์Šต๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ๋ฐ์ดํ„ฐ๋กœ ๊ฐ•ํ™”๋œ LLM ์‘์šฉ์— ์žˆ์–ด ๋งŒ๋Šฅ ํ•ด๊ฒฐ์ฑ…์ด ์กด์žฌํ•˜์ง€ ์•Š๋Š”๋‹ค๊ณ  ๋ฏฟ์Šต๋‹ˆ๋‹ค. ์‹ค์ œ๋กœ ์„ฑ๊ณผ ๋ถ€์ง„์€ ์ข…์ข… ์ž‘์—…์˜ ํ•ต์‹ฌ ์ดˆ์ ์„ ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ํŒŒ์•…ํ•˜์ง€ ๋ชปํ•˜๊ฑฐ๋‚˜, ์ž‘์—…์ด ๋ณธ์งˆ์ ์œผ๋กœ ์—ฌ๋Ÿฌ ๋Šฅ๋ ฅ์„ ์กฐํ•ฉํ•ด์•ผ ํ•˜๋Š” ๊ฒฝ์šฐ๋กœ ์ธํ•ด ๋ฐœ์ƒํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋Šฅ๋ ฅ์„ ๋ถ„๋ฆฌํ•ด ๋ฌธ์ œ ํ•ด๊ฒฐ์— ์ตœ์ ํ™”ํ•˜์ง€ ๋ชปํ–ˆ๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค.

์ด ๋…ผ๋ฌธ์—์„œ๋Š” RAG ์ž‘์—… ๋ถ„๋ฅ˜ ๋ฐฉ๋ฒ• ์„ ์ œ์•ˆํ•˜๋ฉฐ, ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ์˜ ์œ ํ˜•๊ณผ ์ž‘์—…์˜ ์ฃผ์š” ์ดˆ์ ์— ๋”ฐ๋ผ ์‚ฌ์šฉ์ž ์ฟผ๋ฆฌ๋ฅผ ๋„ค ๊ฐ€์ง€ ์ˆ˜์ค€์œผ๋กœ ๋ถ„๋ฅ˜ํ•ฉ๋‹ˆ๋‹ค: ๋ช…์‹œ์  ์‚ฌ์‹ค ์ฟผ๋ฆฌ(= explicit fact query), ์•”์‹œ์  ์‚ฌ์‹ค ์ฟผ๋ฆฌ(= implicit fact query), ํ•ด์„ ๊ฐ€๋Šฅํ•œ ๊ทผ๊ฑฐ ์ฟผ๋ฆฌ(= interpretable rationale query), ์ˆจ๊ฒจ์ง„ ๊ทผ๊ฑฐ ์ฟผ๋ฆฌ(= hidden rationale query). ์šฐ๋ฆฌ๋Š” ์ด๋Ÿฌํ•œ ์ฟผ๋ฆฌ ์ˆ˜์ค€์„ ์ •์˜ํ•˜๊ณ , ๊ด€๋ จ ๋ฐ์ดํ„ฐ์…‹์„ ์ œ๊ณตํ•˜๋ฉฐ, ์ด๋Ÿฌํ•œ ๊ณผ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๋ฐ ์žˆ์–ด ์ฃผ์š” ๋„์ „ ๊ณผ์ œ์™€ ๊ฐ€์žฅ ํšจ๊ณผ์ ์ธ ๊ธฐ์ˆ ์„ ์š”์•ฝํ•ฉ๋‹ˆ๋‹ค. ๋งˆ์ง€๋ง‰์œผ๋กœ, ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๋ฅผ LLM์— ํ†ตํ•ฉํ•˜๋Š” ์„ธ ๊ฐ€์ง€ ์ฃผ์š” ํ˜•ํƒœ๋ฅผ ๋…ผ์˜ํ•ฉ๋‹ˆ๋‹ค: ์ปจํ…์ŠคํŠธ ์ œ๊ณต, ์†Œํ˜• ๋ชจ๋ธ ํ™œ์šฉ, ํŒŒ์ธํŠœ๋‹. ๊ฐ๊ฐ์˜ ๊ฐ•์ , ํ•œ๊ณ„, ๊ทธ๋ฆฌ๊ณ  ์ ํ•ฉํ•œ ๋ฌธ์ œ ์œ ํ˜•์„ ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค. ๋ณธ ์—ฐ๊ตฌ๋Š” ๋…์ž๋“ค์ด LLM ์‘์šฉ ๊ฐœ๋ฐœ ์‹œ ๋ฐ์ดํ„ฐ ์š”๊ตฌ ์‚ฌํ•ญ๊ณผ ์ฃผ์š” ๋ณ‘๋ชฉํ˜„์ƒ์„ ์ฒ ์ €ํžˆ ์ดํ•ดํ•˜๊ณ  ๋ถ„ํ•ดํ•  ์ˆ˜ ์žˆ๋„๋ก ๋•๊ณ , ๋‹ค์–‘ํ•œ ๋„์ „ ๊ณผ์ œ์— ๋Œ€ํ•œ ํ•ด๊ฒฐ์ฑ…์„ ์ œ์‹œํ•˜๋ฉฐ, ์ด๋Ÿฌํ•œ ์‘์šฉ์„ ์ฒด๊ณ„์ ์œผ๋กœ ๊ฐœ๋ฐœํ•˜๋Š” ๋ฐ ์žˆ์–ด ๊ฐ€์ด๋“œ ์—ญํ• ์„ ํ•˜๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ๋กœ ํ•ฉ๋‹ˆ๋‹ค.

1. Introduction

๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์€ ๊ด‘๋ฒ”์œ„ํ•œ ์„ธ๊ณ„ ์ง€์‹๊ณผ ์ •๊ตํ•œ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํฌํ•จํ•˜์—ฌ ๋†€๋ผ์šด ์—ญ๋Ÿ‰์„ ๋ณด์—ฌ์ฃผ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ด๋Ÿฌํ•œ ๋ฐœ์ „์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ , ๋‹ค์–‘ํ•œ ์ „๋ฌธ ๋ถ„์•ผ์— ํšจ๊ณผ์ ์œผ๋กœ ์ ์šฉํ•˜๋Š” ๋ฐ๋Š” ์—ฌ์ „ํžˆ ์ค‘์š”ํ•œ ๊ณผ์ œ๋“ค์ด ์กด์žฌํ•ฉ๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์—๋Š” ๋ชจ๋ธ์˜ ํ™˜๊ฐ(= hallucination), ํŠน์ • ๋„๋ฉ”์ธ ์ง€์‹๊ณผ์˜ ๋ถˆ์ผ์น˜(= misalignment with domain-specific knowledge) ๋“ฑ๊ณผ ๊ฐ™์€ ๋ฌธ์ œ๊ฐ€ ํฌํ•จ๋ฉ๋‹ˆ๋‹ค. ํŠนํžˆ ์ดˆ๊ธฐ ํ•™์Šต ๋ฐ์ดํ„ฐ์…‹์— ํฌํ•จ๋˜์ง€ ์•Š์€ ๋น„๊ณต๊ฐœ ๋ฐ์ดํ„ฐ๋‚˜ ์˜จํ”„๋ ˆ๋ฏธ์Šค ๋ฐ์ดํ„ฐ์™€ ๊ฐ™์€ ๋„๋ฉ”์ธ๋ณ„ ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ฉํ•˜๋Š” ๊ฒƒ์€ ํŠน์ • ์‚ฐ์—…์˜ ์š”๊ตฌ๋ฅผ ์ถฉ์กฑ์‹œํ‚ค๊ธฐ ์œ„ํ•ด LLM ์‘์šฉ ํ”„๋กœ๊ทธ๋žจ์„ ๋งž์ถคํ™”ํ•˜๋Š” ๋ฐ ๋งค์šฐ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ๊ฒ€์ƒ‰ ๊ธฐ๋ฐ˜ ์ƒ์„ฑ(RAG) ๋ฐ ํŒŒ์ธํŠœ๋‹๊ณผ ๊ฐ™์€ ๊ธฐ์ˆ ์„ ํ†ตํ•ด ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•œ LLM ์‘์šฉ ํ”„๋กœ๊ทธ๋žจ์€ ๊ธฐ์กด์˜ ์ผ๋ฐ˜์ ์ธ LLM๋งŒ์œผ๋กœ ๊ตฌ์ถ•๋œ ์‘์šฉ ํ”„๋กœ๊ทธ๋žจ์— ๋น„ํ•ด ์—ฌ๋Ÿฌ ์ธก๋ฉด์—์„œ ์šฐ์œ„๋ฅผ ๋ณด์—ฌ์ฃผ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

  • ํ–ฅ์ƒ๋œ ์ „๋ฌธ์„ฑ๊ณผ ์‹œ์˜์„ฑ (= Enhanced Professionalism and Timeliness) : LLM ํ•™์Šต์— ์‚ฌ์šฉ๋œ ๋ฐ์ดํ„ฐ๋Š” ์‹œ์˜์„ฑ์ด ๋ถ€์กฑํ•˜๊ฑฐ๋‚˜ ํŠน์ • ๋„๋ฉ”์ธ์„ ํฌ๊ด„์ ์œผ๋กœ ๋‹ค๋ฃจ์ง€ ๋ชปํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ํŠนํžˆ ์‚ฌ์šฉ์ž๊ฐ€ ์†Œ์œ ํ•œ ๋…์  ๋ฐ์ดํ„ฐ๋Š” ํฌํ•จ๋˜์ง€ ์•Š๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์Šต๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•œ LLM ์‘์šฉ ํ”„๋กœ๊ทธ๋žจ์€ ๋ณต์žกํ•œ ์งˆ๋ฌธ์— ๋Œ€ํ•ด ๋ณด๋‹ค ์ƒ์„ธํ•˜๊ณ  ์ •ํ™•ํ•œ ๋‹ต๋ณ€์„ ์ œ๊ณตํ•˜๋ฉฐ, ๋ฐ์ดํ„ฐ ์—…๋ฐ์ดํŠธ์™€ ๋งž์ถคํ™”๋ฅผ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•จ์œผ๋กœ์จ ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•ฉ๋‹ˆ๋‹ค.

  • ๋„๋ฉ”์ธ ์ „๋ฌธ๊ฐ€์™€์˜ ์ผ์น˜์„ฑ (=Alignment with Domain Experts) : ๋„๋ฉ”์ธ๋ณ„ ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•˜๊ณ  ํ•™์Šตํ•จ์œผ๋กœ์จ ๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ•ํ™”ํ•œ LLM ์‘์šฉ ํ”„๋กœ๊ทธ๋žจ์€ ์˜์‚ฌ๋‚˜ ๋ณ€ํ˜ธ์‚ฌ์™€ ๊ฐ™์€ ๋„๋ฉ”์ธ ์ „๋ฌธ๊ฐ€์— ๋” ๊ฐ€๊นŒ์šด ์—ญ๋Ÿ‰์„ ๋ฐœํœ˜ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

  • ๋ชจ๋ธ ํ™˜๊ฐ ๊ฐ์†Œ (= Reduction in Model Hallucination) : ๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์‘๋‹ต์„ ์ƒ์„ฑํ•จ์œผ๋กœ์จ, ๋ฐ์ดํ„ฐ๋กœ ๊ฐ•ํ™”๋œ LLM ์‘์šฉ ํ”„๋กœ๊ทธ๋žจ์€ ์‚ฌ์‹ค์— ๊ทผ๊ฑฐํ•œ ๋ฐ˜์‘์„ ์ œ๊ณตํ•˜๋ฉฐ, ํ™˜๊ฐ(hallucination) ๋ฐœ์ƒ ๊ฐ€๋Šฅ์„ฑ์„ ํฌ๊ฒŒ ์ค„์ž…๋‹ˆ๋‹ค.

  • ํ–ฅ์ƒ๋œ ์ œ์–ด ๊ฐ€๋Šฅ์„ฑ๊ณผ ์„ค๋ช… ๊ฐ€๋Šฅ์„ฑ (= Improved Controllability and Explainability) : ์‚ฌ์šฉ๋œ ๋ฐ์ดํ„ฐ๋Š” ๋ชจ๋ธ์˜ ์˜ˆ์ธก์— ๋Œ€ํ•œ ์ฐธ์กฐ๋กœ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ์–ด, ์ œ์–ด ๊ฐ€๋Šฅ์„ฑ๊ณผ ์„ค๋ช… ๊ฐ€๋Šฅ์„ฑ์„ ๋ชจ๋‘ ๊ฐ•ํ™”ํ•ฉ๋‹ˆ๋‹ค.

์ด๋Ÿฌํ•œ ๋ฐœ์ „์— ๋Œ€ํ•œ ๊ธฐ๋Œ€๊ฐ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ , ๊ฐœ๋ฐœ์ž๋“ค์€ ๋†’์€ ์„ฑ๊ณต๋ฅ (์˜ˆ: ์งˆ์˜์‘๋‹ต์—์„œ์˜ ๋†’์€ ์ •ํ™•๋„)์„ ๋‹ฌ์„ฑํ•˜๊ธฐ ์œ„ํ•ด ๋งŽ์€ ์ธ์  ์ž์›์„ ํˆฌ์žํ•ด์•ผ ํ•˜๋Š” ์–ด๋ ค์›€์— ์ง๋ฉดํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋‹ค์–‘ํ•œ ์—ฐ๊ตฌ์—์„œ๋Š” ๊ฒ€์ƒ‰ ๊ธฐ๋ฐ˜ ์ƒ์„ฑ(RAG)์ด๋‚˜ ํŒŒ์ธํŠœ๋‹๊ณผ ๊ฐ™์€ ๊ธฐ์ˆ ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ ๋ฐ์ดํ„ฐ๋กœ ๊ฐ•ํ™”๋œ LLM ์‘์šฉ ํ”„๋กœ๊ทธ๋žจ์„ ๊ตฌ์ถ•ํ•˜๋Š” ๊ณผ์ •์—์„œ ํŠนํžˆ ๋ฒ•๋ฅ , ์˜๋ฃŒ, ์ œ์กฐ์™€ ๊ฐ™์€ ์ „๋ฌธ ๋ถ„์•ผ์—์„œ ๋ฐœ์ƒํ•˜๋Š” ๋„์ „๊ณผ ์ขŒ์ ˆ์„ ๊ฐ•์กฐํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์ด๋Ÿฌํ•œ ๋„์ „ ๊ณผ์ œ๋Š” ๋ฐ์ดํ„ฐ ํŒŒ์ดํ”„๋ผ์ธ ๊ตฌ์ถ•(์˜ˆ: ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ ๋ฐ ์ƒ‰์ธ ์ƒ์„ฑ)์—์„œ๋ถ€ํ„ฐ LLM์˜ ๋Šฅ๋ ฅ์„ ํ™œ์šฉํ•˜์—ฌ ๋ณต์žกํ•œ ์ง€๋Šฅํ˜• ์ถ”๋ก ์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ฐ ์ด๋ฅด๊ธฐ๊นŒ์ง€ ๊ด‘๋ฒ”์œ„ํ•˜๊ฒŒ ๊ฑธ์ณ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๊ธˆ์œต ๋ถ„์•ผ ์‘์šฉ ํ”„๋กœ๊ทธ๋žจ์—์„œ๋Š” ๊ณ ์ฐจ์› ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ๋ฅผ ์ดํ•ดํ•˜๊ณ  ํ™œ์šฉํ•ด์•ผ ํ•˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ์ž์ฃผ ๋ฐœ์ƒํ•˜๋ฉฐ, ์˜๋ฃŒ ๋ถ„์•ผ์—์„œ๋Š” ์˜๋ฃŒ ์ด๋ฏธ์ง€๋‚˜ ์‹œ๊ณ„์—ด ์˜๋ฃŒ ๊ธฐ๋ก์ด ํ•„์ˆ˜์ ์ž…๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋‹ค์–‘ํ•œ ํ˜•ํƒœ์˜ ๋ฐ์ดํ„ฐ๋ฅผ LLM์ด ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” ๊ฒƒ์€ ๋ฐ˜๋ณต์ ์œผ๋กœ ๋‚˜ํƒ€๋‚˜๋Š” ๊ณผ์ œ์ž…๋‹ˆ๋‹ค.

ํ•œํŽธ, ๋ฒ•๋ฅ  ๋ฐ ์ˆ˜ํ•™ ์‘์šฉ ๋ถ„์•ผ์—์„œ๋Š” LLM์ด ์„œ๋กœ ๋‹ค๋ฅธ ๊ตฌ์กฐ ๊ฐ„์˜ ์žฅ๊ฑฐ๋ฆฌ ์˜์กด์„ฑ์„ ์ดํ•ดํ•˜๋Š” ๋ฐ ์–ด๋ ค์›€์„ ๊ฒช๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ํŠน์ • ์‘์šฉ ๋ถ„์•ผ์— ๋”ฐ๋ผ LLM ์‘๋‹ต์˜ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ๊ณผ ์ผ๊ด€์„ฑ์— ๋Œ€ํ•œ ์š”๊ตฌ๊ฐ€ ์ฆ๊ฐ€ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ LLM์€ ๋ณธ์งˆ์ ์œผ๋กœ ๋‚ฎ์€ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ๊ณผ ๋†’์€ ๋ถˆํ™•์‹ค์„ฑ์œผ๋กœ ํŠน์ง•์ง€์–ด์ง€๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์•„ ์ด๋Ÿฌํ•œ ์š”๊ตฌ๋ฅผ ์ถฉ์กฑ์‹œํ‚ค๋Š” ๋ฐ ์–ด๋ ค์›€์ด ๋”ฐ๋ฆ…๋‹ˆ๋‹ค. ํŠนํžˆ ์ •๋ฐ€์„ฑ๊ณผ ์ฑ…์ž„์ด ์ค‘์š”ํ•œ ๋ถ„์•ผ์—์„œ๋Š” LLM์˜ ํˆฌ๋ช…์„ฑ์„ ๋†’์ด๊ณ  ๋ถˆํ™•์‹ค์„ฑ์„ ์ค„์ด๋Š” ๊ฒƒ์ด ๊ฒฐ๊ณผ์— ๋Œ€ํ•œ ์‹ ๋ขฐ์„ฑ๊ณผ ์‹ ๋ขฐ๋ฅผ ๋†’์ด๋Š” ๋ฐ ๋งค์šฐ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.

๋„๋ฉ”์ธ ์ „๋ฌธ๊ฐ€์™€ ๊ฐœ๋ฐœ์ž๋“ค๊ณผ์˜ ๊ด‘๋ฒ”์œ„ํ•œ ๋…ผ์˜, ๊ทธ๋ฆฌ๊ณ  ๊ทธ๋“ค์ด ์ง๋ฉดํ•œ ๋ฌธ์ œ๋“ค์„ ๋ฉด๋ฐ€ํžˆ ๋ถ„์„ํ•œ ๊ฒฐ๊ณผ, ๋ฐ์ดํ„ฐ๋กœ ๊ฐ•ํ™”๋œ LLM ์‘์šฉ ํ”„๋กœ๊ทธ๋žจ์ด ๋งŒ๋Šฅ ํ•ด๊ฒฐ์ฑ…์ด ์•„๋‹˜์„ ๊นŠ์ด ์ดํ•ดํ•˜๊ฒŒ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ์ „๋ฌธ ๋ถ„์•ผ์—์„œ๋Š” ํ˜„์‹ค์ ์ธ ์š”๊ตฌ๊ฐ€ ๋งค์šฐ ๋ณต์žกํ•˜๋ฉฐ, ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ์™€์˜ ๊ด€๊ณ„๋‚˜ ํ•„์š”ํ•œ ์ถ”๋ก ์˜ ๋‚œ์ด๋„์—์„œ ํฌ๊ฒŒ ์ฐจ์ด๋‚  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๊ฐœ๋ฐœ์ž๋“ค์€ ์ข…์ข… ์ด๋Ÿฌํ•œ ์ฐจ์ด๋ฅผ ์ธ์‹ํ•˜์ง€ ๋ชปํ•œ ์ฑ„, ์„ฑ๋Šฅ ์ €ํ•˜ ๋ฌธ์ œ๋กœ ๊ฐ€๋“ ์ฐฌ ์†”๋ฃจ์…˜ (๋น„์œ ํ•˜์ž๋ฉด, ์—ฌ๊ธฐ์ €๊ธฐ ๋ฌผ์ด ์ƒˆ๋Š” ์ง‘๊ณผ ๊ฐ™์€)์„ ๋งŒ๋“ค์–ด๋‚ด๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด, ์„œ๋กœ ๋‹ค๋ฅธ ์ˆ˜์ค€์˜ ์š”๊ตฌ์™€ ๊ทธ์— ๋”ฐ๋ฅธ ๋…ํŠนํ•œ ๋„์ „ ๊ณผ์ œ๋ฅผ ์ถฉ๋ถ„ํžˆ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋‹ค๋ฉด, ๊ทธ์— ๋งž๊ฒŒ ์‘์šฉ ํ”„๋กœ๊ทธ๋žจ์„ ๊ตฌ์ถ•ํ•˜๊ณ  ๋‹จ๊ณ„์ ์œผ๋กœ ๊ฒฌ๊ณ ํ•˜๊ณ  ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ํ”„๋กœ๊ทธ๋žจ(๋งˆ์น˜ ํ•œ ๋‹จ๊ณ„์”ฉ ํŠผํŠผํ•œ ์ง‘์„ ์ง“๋Š” ๊ฒƒ์ฒ˜๋Ÿผ)์„ ๋งŒ๋“ค์–ด๊ฐˆ ์ˆ˜ ์žˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

ํ•˜์ง€๋งŒ, ๊ธฐ์กด์˜ ์—ฐ๊ตฌ์™€ ๊ด€๋ จ๋œ ์„ค๋ฌธ ์กฐ์‚ฌ๋Š” ์ข…์ข… ์ด๋Ÿฌํ•œ ์ˆ˜์ค€ ์ค‘ ํ•˜๋‚˜ ๋˜๋Š” ํŠน์ • ๊ธฐ์ˆ  ์ฃผ์ œ์—๋งŒ ์ดˆ์ ์„ ๋งž์ถ”๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•˜๊ธฐ ์œ„ํ•ด, ์šฐ๋ฆฌ๋Š” ์ด ํฌ๊ด„์ ์ธ ์„ค๋ฌธ ์กฐ์‚ฌ๋ฅผ ์ž‘์„ฑํ•˜๊ฒŒ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด ์กฐ์‚ฌ๋Š” ์„œ๋กœ ๋‹ค๋ฅธ ์ฟผ๋ฆฌ ์ˆ˜์ค€์„ ๋ช…ํ™•ํžˆ ์ •์˜ํ•˜๊ณ , ๊ฐ๊ฐ์— ์ˆ˜๋ฐ˜๋˜๋Š” ๊ณ ์œ ํ•œ ๋„์ „ ๊ณผ์ œ๋ฅผ ์‹๋ณ„ํ•˜๋ฉฐ (Figure 01), ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ ๊ด€๋ จ ์—ฐ๊ตฌ์™€ ๋…ธ๋ ฅ์„ ๋‚˜์—ดํ•˜๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ๋กœ ํ•ฉ๋‹ˆ๋‹ค. ์ด ์„ค๋ฌธ ์กฐ์‚ฌ๋Š” ๋…์ž๋“ค์ด ๋ฐ์ดํ„ฐ๋กœ ๊ฐ•ํ™”๋œ LLM ์‘์šฉ ํ”„๋กœ๊ทธ๋žจ์— ๋Œ€ํ•œ ์กฐ๊ฐ๋„๋ฅผ ๊ฐ–๋„๋ก ๋•๊ณ , ์ด๋Ÿฌํ•œ ์‘์šฉ ํ”„๋กœ๊ทธ๋žจ์„ ์ฒด๊ณ„์ ์œผ๋กœ ๊ฐœ๋ฐœํ•˜๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•œ ์•ˆ๋‚ด์„œ ์—ญํ• ์„ ํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค.

2. Problem Definition

๋ฐ์ดํ„ฐ๋กœ augmented๋œ LLM application์€ ๋„๋ฉ”์ธ๋ณ„ ๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๋Š” ์งˆ๋ฌธ-์‘๋‹ต ๋ด‡์—์„œ๋ถ€ํ„ฐ ๋ณต์žกํ•œ ๋ฐ์ดํ„ฐ ํŒŒ์ดํ”„๋ผ์ธ ๋‚ด์—์„œ์˜ ์˜๋ฏธ์  ์ฒ˜๋ฆฌ ์—ฐ์‚ฐ์ž, ๋˜๋Š” ๋‹ค์ค‘ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์—์„œ ํŠน์ • ๋‹จ๊ณ„๋ฅผ ์ฒ˜๋ฆฌํ•˜๋Š” ์—์ด์ „ํŠธ์— ์ด๋ฅด๊ธฐ๊นŒ์ง€ ๋‹ค์–‘ํ•œ ํ˜•ํƒœ๋ฅผ ์ทจํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ผ๋ฐ˜์ ์œผ๋กœ ๋ฐ์ดํ„ฐ๋กœ augmented๋œ LLM application์€ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๊ณต์‹์„ ๋”ฐ๋ฅธ๋‹ค:

2.1 Stratification of Queries

๋ฐ์ดํ„ฐ๋กœ augmented๋œ LLM application์˜ ๋งฅ๋ฝ์—์„œ, Query๋Š” ๋ณต์žก์„ฑ๊ณผ ์š”๊ตฌ๋˜๋Š” ๋ฐ์ดํ„ฐ ์ƒํ˜ธ์ž‘์šฉ์˜ ๊นŠ์ด์— ๋”ฐ๋ผ ๊ณ„์ธตํ™”๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๊ณ„์ธตํ™”๋Š” LLM์ด ์ •ํ™•ํ•˜๊ณ  ๊ด€๋ จ์„ฑ ๋†’์€ ์‘๋‹ต์„ ์ƒ์„ฑํ•˜๊ธฐ ์œ„ํ•ด ์ˆ˜ํ–‰ํ•ด์•ผ ํ•˜๋Š” ๋‹ค์–‘ํ•œ ์ˆ˜์ค€์˜ ์ธ์ง€์  ์ฒ˜๋ฆฌ๋ฅผ ์ดํ•ดํ•˜๋Š” ๋ฐ ๋„์›€์„ ์ค๋‹ˆ๋‹ค. ๋‹จ์ˆœํ•œ ์‚ฌ์‹ค ๊ฒ€์ƒ‰์—์„œ ์•”์‹œ์  ์ง€์‹์˜ ์ •๊ตํ•œ ํ•ด์„์— ์ด๋ฅด๊ธฐ๊นŒ์ง€, ๊ฐ ๊ณ„์ธต์€ LLM์ด ์ฒ˜๋ฆฌํ•ด์•ผ ํ•  ๊ณผ์ œ์˜ ์ •๊ตํ•จ์ด ํ•œ ๋‹จ๊ณ„์”ฉ ๋†’์•„์ง€๋Š” ๊ฒƒ์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค. ์•„๋ž˜์—์„œ๋Š” ์ด๋Ÿฌํ•œ ๊ณ„์ธต์„ ๊ตฌ๋ถ„ํ•˜์—ฌ ๊ฐ ๋‹จ๊ณ„์—์„œ ์š”๊ตฌ๋˜๋Š” ๊ณ ์œ ํ•œ ๋„์ „ ๊ณผ์ œ์™€ ํ•„์š” ์—ญ๋Ÿ‰์— ๋Œ€ํ•œ ํ†ต์ฐฐ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

Level 1 : Explicit Facts

์ด๋Ÿฌํ•œ ์งˆ๋ฌธ์€ ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ์— ๋ช…์‹œ์ ์œผ๋กœ ์กด์žฌํ•˜๋Š” ์‚ฌ์‹ค์„ ์ง์ ‘์ ์œผ๋กœ ๋ฌป๋Š” ๊ฒƒ์œผ๋กœ, ์ถ”๊ฐ€์ ์ธ ์ถ”๋ก ์ด ํ•„์š”ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๊ฐ€์žฅ ๊ฐ„๋‹จํ•œ ํ˜•ํƒœ์˜ ์งˆ๋ฌธ์œผ๋กœ, ๋ชจ๋ธ์˜ ์ฃผ์š” ๊ณผ์ œ๋Š” ๊ด€๋ จ ์ •๋ณด๋ฅผ ์ฐพ์•„ ์ถ”์ถœํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, "2024๋…„ ํ•˜๊ณ„ ์˜ฌ๋ฆผํ”ฝ์€ ์–ด๋””์—์„œ ์—ด๋ฆฌ๋‚˜์š”?"๋ผ๋Š” ์งˆ๋ฌธ์€ ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ์— ํฌํ•จ๋œ ์‚ฌ์‹ค์„ ๋ชฉํ‘œ๋กœ ํ•ฉ๋‹ˆ๋‹ค.

Level 2 : Implicit Facts

์ด๋Ÿฌํ•œ ์งˆ๋ฌธ์€ ๋ฐ์ดํ„ฐ์— ํฌํ•จ๋œ ๋ช…์‹œ์ ์ด์ง€ ์•Š์€ ์‚ฌ์‹ค์„ ๋ฌป๋Š” ๊ฒƒ์œผ๋กœ, ์ฆ‰๊ฐ์ ์œผ๋กœ ๋“œ๋Ÿฌ๋‚˜์ง€ ์•Š์œผ๋ฉฐ ์–ด๋Š ์ •๋„์˜ ์ƒ์‹์  ์ถ”๋ก ์ด๋‚˜ ๊ธฐ๋ณธ์ ์ธ ๋…ผ๋ฆฌ์  ์œ ์ถ”๊ฐ€ ํ•„์š”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํ•„์š”ํ•œ ์ •๋ณด๋Š” ์—ฌ๋Ÿฌ ๋ถ€๋ถ„์— ํฉ์–ด์ ธ ์žˆ๊ฑฐ๋‚˜ ๊ฐ„๋‹จํ•œ ์ถ”๋ก  ๊ณผ์ •์„ ๊ฑฐ์ณ์•ผ ํ•  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, "์บ”๋ฒ„๋ผ๊ฐ€ ์œ„์น˜ํ•œ ๊ตญ๊ฐ€์—์„œ ํ˜„์žฌ ๋‹ค์ˆ˜๋‹น์€ ๋ฌด์—‡์ธ๊ฐ€์š”?"๋ผ๋Š” ์งˆ๋ฌธ์€ ์บ”๋ฒ„๋ผ๊ฐ€ ํ˜ธ์ฃผ์— ์žˆ๋‹ค๋Š” ์‚ฌ์‹ค๊ณผ ํ˜ธ์ฃผ์˜ ํ˜„์žฌ ๋‹ค์ˆ˜๋‹น์— ๋Œ€ํ•œ ์ •๋ณด๋ฅผ ๊ฒฐํ•ฉํ•˜์—ฌ ๋‹ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

Level 3 : Interpretable Rationales

์ด๋Ÿฌํ•œ ์งˆ๋ฌธ์€ ๋‹จ์ˆœํžˆ ์‚ฌ์‹ค์  ๋‚ด์šฉ์„ ์ดํ•ดํ•˜๋Š” ๊ฒƒ์„ ๋„˜์–ด, ๋ฐ์ดํ„ฐ์˜ ๋งฅ๋ฝ์— ํ†ตํ•ฉ๋œ ๋ถ„์•ผ๋ณ„ ๋…ผ๋ฆฌ๋ฅผ ์ดํ•ดํ•˜๊ณ  ์ ์šฉํ•˜๋Š” ๋Šฅ๋ ฅ์„ ์š”๊ตฌํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋…ผ๋ฆฌ๋Š” ์™ธ๋ถ€ ์ž๋ฃŒ์— ๋ช…์‹œ์ ์œผ๋กœ ์ œ๊ณต๋˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์œผ๋ฉฐ, ์ผ๋ฐ˜์ ์ธ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์˜ ์‚ฌ์ „ ํ•™์Šต ๋‹จ๊ณ„์—์„œ๋Š” ํฌํ•จ๋˜์ง€ ์•Š๊ฑฐ๋‚˜ ๋“œ๋ฌผ๊ฒŒ ์ ‘ํ•˜๊ฒŒ ๋˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์ œ์•ฝ ๋ถ„์•ผ์—์„œ๋Š” ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์ด FDA ๊ฐ€์ด๋“œ๋ผ์ธ(FDA Guidance) ๋ฌธ์„œ๋ฅผ ํ•ด์„ํ•˜์—ฌ ํŠน์ • ์•ฝ๋ฌผ ์‹ ์ฒญ์ด ๊ทœ์ œ ์š”๊ตฌ์‚ฌํ•ญ์„ ์ค€์ˆ˜ํ•˜๋Š”์ง€ ํ‰๊ฐ€ํ•ด์•ผ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋น„์Šทํ•˜๊ฒŒ, ๊ณ ๊ฐ ์ง€์› ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ๋Š” ์‚ฌ์šฉ์ž ๋ฌธ์˜๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ์ฒ˜๋ฆฌํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์ „์— ์ •์˜๋œ ์›Œํฌํ”Œ๋กœ์šฐ์˜ ๋ณต์žก์„ฑ์„ ์ดํ•ดํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์˜๋ฃŒ ๋ถ„์•ผ์—์„œ๋Š” ๊ธ‰์„ฑ ํ‰ํ†ต ํ™˜์ž ๊ด€๋ฆฌ๋ฅผ ์œ„ํ•œ ์ง€์นจ๊ณผ ๊ฐ™์€ ํ‘œ์ค€ํ™”๋œ ์ง„๋‹จ ๊ธฐ์ค€์„ ์ œ๊ณตํ•˜๋Š” ๋งŽ์€ ์ง„๋‹จ ๋งค๋‰ด์–ผ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์™ธ๋ถ€ ๋…ผ๋ฆฌ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ๋”ฐ๋ฆ„์œผ๋กœ์จ ํ‰ํ†ต ๊ด€๋ฆฌ์™€ ๊ฐ™์€ ํŠน์ • ๋ถ„์•ผ์— ์ „๋ฌธํ™”๋œ ์–ธ์–ด ๋ชจ๋ธ ์ „๋ฌธ๊ฐ€ ์‹œ์Šคํ…œ์„ ๊ฐœ๋ฐœํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๊ณ ๊ฐ ์ง€์› ๋‹ด๋‹น์ž์˜ ์ƒํ˜ธ์ž‘์šฉ์„ ์•ˆ๋‚ดํ•˜๋Š” ์ ˆ์ฐจ์  ๋‹จ๊ณ„์™€ ์˜์‚ฌ ๊ฒฐ์ • ํŠธ๋ฆฌ๋ฅผ ์ดํ•ดํ•˜์—ฌ, ์‘๋‹ต์ด ์ •ํ™•ํ•  ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ํšŒ์‚ฌ์˜ ์„œ๋น„์Šค ๊ธฐ์ค€๊ณผ ํ”„๋กœํ† ์ฝœ์„ ์ค€์ˆ˜ํ•˜๋„๋ก ๋ณด์žฅํ•˜๋Š” ๊ฒƒ์„ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค.

Level 4 : Hidden Rationales

์ด ๋ฒ”์ฃผ์˜ ์งˆ๋ฌธ์€ ๋” ์–ด๋ ค์šด ์˜์—ญ์œผ๋กœ, ๋…ผ๋ฆฌ๊ฐ€ ๋ช…์‹œ์ ์œผ๋กœ ๋ฌธ์„œํ™”๋˜์–ด ์žˆ์ง€ ์•Š๊ณ , ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ์—์„œ ๊ด€์ฐฐ๋œ ํŒจํ„ด๊ณผ ๊ฒฐ๊ณผ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์ถ”๋ก ํ•ด์•ผ ํ•˜๋Š” ๊ฒฝ์šฐ๋ฅผ ๋‹ค๋ฃน๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ ์ˆจ๊ฒจ์ง„ ๋…ผ๋ฆฌ๋Š” ์•”๋ฌต์ ์ธ ์ถ”๋ก  ์ฒด๊ณ„์™€ ๋…ผ๋ฆฌ์  ๊ด€๊ณ„๋ฟ๋งŒ ์•„๋‹ˆ๋ผ, ๊ฐ ์งˆ๋ฌธ์— ํ•„์š”ํ•œ ์™ธ๋ถ€ ๋…ผ๋ฆฌ๋ฅผ ์‹๋ณ„ํ•˜๊ณ  ์ถ”์ถœํ•˜๋Š” ๋ณธ์งˆ์ ์œผ๋กœ ๊นŒ๋‹ค๋กญ๊ณ  ๋ณต์žกํ•œ ์ž‘์—…์„ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, IT ์šด์˜ ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ ํด๋ผ์šฐ๋“œ ์šด์˜ ํŒ€์€ ๊ณผ๊ฑฐ์— ์—ฌ๋Ÿฌ ์‚ฌ๊ฑด์„ ์ฒ˜๋ฆฌํ–ˆ์œผ๋ฉฐ, ๊ฐ๊ฐ ๊ณ ์œ ํ•œ ์ƒํ™ฉ๊ณผ ํ•ด๊ฒฐ ๋ฐฉ๋ฒ•์„ ๊ฐ€์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์€ ์ด๋Ÿฌํ•œ ํ’๋ถ€ํ•œ ์•”๋ฌต์  ์ง€์‹์˜ ์ €์žฅ์†Œ๋ฅผ ํƒ์ƒ‰ํ•˜์—ฌ ์„ฑ๊ณต์ ์ธ ์ „๋žต๊ณผ ์˜์‚ฌ ๊ฒฐ์ • ๊ณผ์ •์„ ๋„์ถœํ•  ์ˆ˜ ์žˆ์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ, ์†Œํ”„ํŠธ์›จ์–ด ๊ฐœ๋ฐœ์—์„œ๋Š” ์ด์ „ ๋ฒ„๊ทธ์˜ ๋””๋ฒ„๊น… ๊ธฐ๋ก์ด ํ’๋ถ€ํ•œ ์•”๋ฌต์  ํ†ต์ฐฐ์„ ์ œ๊ณตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ฐ ๋””๋ฒ„๊น… ๊ฒฐ์ •์˜ ๋‹จ๊ณ„๋ณ„ ๋…ผ๋ฆฌ๊ฐ€ ์ฒด๊ณ„์ ์œผ๋กœ ๊ธฐ๋ก๋˜์–ด ์žˆ์ง€ ์•Š์„ ์ˆ˜๋„ ์žˆ์ง€๋งŒ, LLM์€ ํ•ด๋‹น ๊ฒฐ์ •์„ ์ด๋ˆ ๊ธฐ๋ณธ ์›์น™์„ ์ถ”์ถœํ•  ์ˆ˜ ์žˆ์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์ˆจ๊ฒจ์ง„ ๋…ผ๋ฆฌ๋ฅผ ์ข…ํ•ฉํ•จ์œผ๋กœ์จ, LLM์€ ์ •ํ™•ํ•  ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ, ์˜ค๋žœ ๊ฒฝํ—˜์„ ํ†ตํ•ด ์ˆ™๋ จ๋œ ์ „๋ฌธ๊ฐ€๋“ค์ด ๋‹ค๋“ฌ์–ด์˜จ ์•”๋ฌต์ ์ธ ์ „๋ฌธ์„ฑ๊ณผ ๋ฌธ์ œ ํ•ด๊ฒฐ ์ ‘๊ทผ ๋ฐฉ์‹์„ ๋ฐ˜์˜ํ•œ ์‘๋‹ต์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์š”์•ฝํ•˜์ž๋ฉด, ์งˆ๋ฌธ์„ ์—ฌ๋Ÿฌ ์ˆ˜์ค€์œผ๋กœ ๋ถ„๋ฅ˜ํ•˜๋Š” ๊ฒƒ์€ ๋ณต์žก์„ฑ๊ณผ LLM(๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ)์ด ์š”๊ตฌํ•˜๋Š” ์ดํ•ด ์œ ํ˜•์˜ ์ ์ง„์ ์ธ ๋‹จ๊ณ„๋ฅผ ๋ฐ˜์˜ํ•ฉ๋‹ˆ๋‹ค. Figure 01๊ณผ Figure 02์—์„œ ์˜ˆ์‹œ๋œ ๋ฐ”์™€ ๊ฐ™์ด, ์ฒซ ๋ฒˆ์งธ์™€ ๋‘ ๋ฒˆ์งธ ์ˆ˜์ค€์ธ Explicit Facts์™€ Implicit Facts์€ ๊ฐ๊ฐ ๋ช…์‹œ์ ์œผ๋กœ ์ฃผ์–ด์ง„ ์ •๋ณด์ด๋“ , ๊ธฐ๋ณธ์ ์ธ ์ถ”๋ก ์ด ํ•„์š”ํ•œ ์ •๋ณด์ด๋“  ์‚ฌ์‹ค์  ๋ฐ์ดํ„ฐ๋ฅผ ๊ฒ€์ƒ‰ํ•˜๋Š” ๋ฐ ์ดˆ์ ์„ ๋งž์ถฅ๋‹ˆ๋‹ค. ์ด ๋‘ ์ˆ˜์ค€์€ LLM์ด ๋ฐ์ดํ„ฐ๋ฅผ ์ถ”์ถœํ•˜๊ณ  ์ด๋ฅผ ์ผ๊ด€๋œ ์‚ฌ์‹ค๋กœ ์ข…ํ•ฉํ•˜๋Š” ๋Šฅ๋ ฅ์„ ์‹œํ—˜ํ•ฉ๋‹ˆ๋‹ค. ๋ฐ˜๋Œ€๋กœ, Interpretable Rationales์™€ Hidden Rationales๋กœ ์ด๋ฃจ์–ด์ง„ ํ›„์† ๋‘ ์ˆ˜์ค€์€ ๋ฐ์ดํ„ฐ๋ฅผ ๋’ท๋ฐ›์นจํ•˜๋Š” ๋…ผ๋ฆฌ๋ฅผ ํ•™์Šตํ•˜๊ณ  ์ ์šฉํ•˜๋Š” LLM์˜ ๋Šฅ๋ ฅ์— ์ดˆ์ ์„ ๋งž์ถฅ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์ˆ˜์ค€์€ ๊ฐ๊ฐ LLM์ด ์ „๋ฌธ๊ฐ€์  ์‚ฌ๊ณ ๋ฐฉ์‹๊ณผ ์กฐ์œจํ•˜๊ฑฐ๋‚˜ ๋น„๊ตฌ์กฐํ™”๋œ ์—ญ์‚ฌ์  ๋ฐ์ดํ„ฐ์—์„œ ์ง€ํ˜œ๋ฅผ ์ถ”์ถœํ•ด์•ผ ํ•˜๋Š” ๋” ๊นŠ์€ ์ธ์ง€์  ์ฐธ์—ฌ๋ฅผ ์š”๊ตฌํ•ฉ๋‹ˆ๋‹ค.

์ด ๊ธฐ์ค€์— ๋”ฐ๋ผ ์ผ๋ฐ˜์ ์ธ ์‚ฌ์‹ค ๊ธฐ๋ฐ˜ ์งˆ๋ฌธ ๋ฐ์ดํ„ฐ์…‹์„ ๋ถ„๋ฅ˜ํ•œ ๊ฒฐ๊ณผ๋Š” Table 01์— ๋‚˜ํƒ€๋‚˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ฐ ์ˆ˜์ค€์€ ๊ณ ์œ ํ•œ ๊ณผ์ œ๋ฅผ ์ œ์‹œํ•˜๋ฉฐ, ํšจ๊ณผ์ ์œผ๋กœ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ๋งž์ถคํ˜• ์†”๋ฃจ์…˜์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ๋‹ค์Œ ์„น์…˜์—์„œ๋Š” ์ด๋Ÿฌํ•œ ์ˆ˜์ค€์˜ ์„ธ๋ถ€ ์‚ฌํ•ญ์„ ํƒ๊ตฌํ•˜๋ฉฐ, LLM์ด ๋‹ค์–‘ํ•œ ์œ ํ˜•์˜ ์งˆ๋ฌธ์—์„œ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์˜ ๋ณต์žก์„ฑ์„ ๊ทน๋ณตํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” ๊ตฌ์ฒด์ ์ธ ์ „๋žต๊ณผ ๋ฐฉ๋ฒ•๋ก ์„ ์‚ดํŽด๋ณผ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ํƒ๊ตฌ๋Š” LLM์˜ ํ˜„์žฌ ์—ญ๋Ÿ‰์„ ๊ฐ•์กฐํ•˜๋Š” ๋™์‹œ์—, ์ด ๋ถ„์•ผ์—์„œ ์ง„ํ–‰ ์ค‘์ธ ๋ฐœ์ „๊ณผ ๋ฏธ๋ž˜ ์ž ์žฌ๋ ฅ์„ ์กฐ๋ช…ํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค.

3. Explicit Fact Queries (L1)

3.1 Overview

Explicit Fact Query๋Š” data-augmented query ์ค‘ ๊ฐ€์žฅ ๋‹จ์ˆœํ•œ ์œ ํ˜•์— ํ•ด๋‹นํ•ฉ๋‹ˆ๋‹ค. ์ด ์ˆ˜์ค€์˜ ์งˆ๋ฌธ์€ ํ•ด๋‹น ๋„๋ฉ”์ธ ๋‚ด์˜ ํŠน์ • ๋ฌธ์„œ๋‚˜ chunk์— ์ง์ ‘ ์ ‘๊ทผํ•˜์—ฌ ๋‹ต๋ณ€ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์งˆ๋ฌธ์˜ ๋‹ต๋ณ€์€ ์ข…์ข… ๋ฌธ์„œ ๋‚ด์— ๋ช…์‹œ์ ์œผ๋กœ ๊ธฐ์ˆ ๋œ ํ‰๋ฒ”ํ•œ ํ…์ŠคํŠธ ํ˜•ํƒœ๋กœ ์ œ๊ณต๋˜๋ฉฐ, ์‘๋‹ต ์ƒ์„ฑ ๊ณผ์ •์—์„œ ์ตœ์†Œํ•œ์˜ ์ถ”๋ก ์ด๋‚˜ ๊ฐ„๋‹จํ•œ ๋…ผ๋ฆฌ๋งŒ ์š”๊ตฌ๋ฉ๋‹ˆ๋‹ค.

์ด ์ˆ˜์ค€์˜ ๊ฐ€์žฅ ์ค‘์š”ํ•œ ํŠน์ง•์€ ํŠน์ • ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ ์กฐ๊ฐ์— ๋Œ€ํ•ด ๋ช…ํ™•ํ•˜๊ณ  ์ง์ ‘์ ์œผ๋กœ ์˜์กดํ•œ๋‹ค๋Š” ์ ์ž…๋‹ˆ๋‹ค.

3.1.1 Data Dependency

3.1.2 Definition

์ด ์ •์˜๋Š” explicit fact queries๊ฐ€ ๋ณต์žกํ•œ ์ถ”๋ก ์ด๋‚˜ ์‹๋ณ„๋œ ๋ฐ์ดํ„ฐ ์„ธ๊ทธ๋จผํŠธ ๋ฒ”์œ„๋ฅผ ๋„˜์–ด์„œ๋Š” ์ถ”๊ฐ€์ ์ธ ์ถ”๋ก  ์—†์ด, ์ง์ ‘์ ์ธ ๋ฐ์ดํ„ฐ ๊ฒ€์ƒ‰์— ์˜์กดํ•œ๋‹ค๋Š” ์ ์„ ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค. ๋‹ค์Œ์€ ์ด ์ˆ˜์ค€์˜ ์งˆ๋ฌธ์— ํ•ด๋‹นํ•˜๋Š” ๋ช‡ ๊ฐ€์ง€ ์˜ˆ์ž…๋‹ˆ๋‹ค:

  • What method was used in Paper X to solve problem Y? (Given a collection of academic papers)

  • Whatโ€™s the AI strategy of company X? (Given a series of the latest news and articles about company X)

3.2 Challenge and Solutions

์ด ์ˆ˜์ค€์˜ ์งˆ๋ฌธ์€ ์ฃผ๋กœ LLM์ด ์ •ํ™•ํ•œ ์‘๋‹ต์„ ์ œ๊ณตํ•˜๊ธฐ ์œ„ํ•ด ์˜ฌ๋ฐ”๋ฅธ ๋ฐ์ดํ„ฐ๋ฅผ ๊ฒ€์ƒ‰ํ•˜๋Š” ๊ฒƒ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. RAG๋Š” ํšจ๊ณผ์ ์ด๊ณ  ์œ ์—ฐํ•˜๋ฉฐ ๋น„๊ต์  ๋น„์šฉ์ด ๋‚ฎ๊ธฐ ๋•Œ๋ฌธ์— ์ด ์ˆ˜์ค€์˜ ์งˆ๋ฌธ์„ ์ฒ˜๋ฆฌํ•˜๋Š” ๋ฐ ๊ฐ€์žฅ ๋„๋ฆฌ ์ฑ„ํƒ๋˜๋Š” ๊ธฐ์ˆ  ์†”๋ฃจ์…˜์ž…๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ RAG๋ฅผ ์‚ฌ์šฉํ•˜๋”๋ผ๋„ ๊ฒฌ๊ณ ํ•˜๊ณ  ๊ณ ํ’ˆ์งˆ์˜ ์‹œ์Šคํ…œ์„ ๊ตฌ์ถ•ํ•˜๋Š” ๋ฐ๋Š” ์ƒ๋‹นํ•œ ๋„์ „ ๊ณผ์ œ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๊ณผ์ œ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:

  • ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ์˜ ์–ด๋ ค์›€:

    ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๋Š” ์ข…์ข… ๋งค์šฐ ๋น„์ •ํ˜•์ ์ด๋ฉฐ, ํ‘œ, ์ด๋ฏธ์ง€, ๋™์˜์ƒ ๋“ฑ๊ณผ ๊ฐ™์€ ๋‹ค์ค‘ ๋ชจ๋“œ ๊ตฌ์„ฑ ์š”์†Œ๋ฅผ ํฌํ•จํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ์ด๋Ÿฌํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ์„ธ๊ทธ๋จผํŠธํ™”ํ•˜๊ฑฐ๋‚˜ "์ฒญํ‚น(chunking)"ํ•˜๋Š” ๊ณผ์ •์—์„œ ์›๋ž˜์˜ ๋งฅ๋ฝ๊ณผ ์˜๋ฏธ๋ฅผ ์œ ์ง€ํ•˜๋Š” ๋ฐ ์–ด๋ ค์›€์ด ๋”ฐ๋ฆ…๋‹ˆ๋‹ค.

  • ๋ฐ์ดํ„ฐ ๊ฒ€์ƒ‰์˜ ์–ด๋ ค์›€:

    ๋Œ€๊ทœ๋ชจ ๋น„์ •ํ˜• ๋ฐ์ดํ„ฐ์…‹์—์„œ ๊ด€๋ จ ๋ฐ์ดํ„ฐ ์„ธ๊ทธ๋จผํŠธ๋ฅผ ๊ฒ€์ƒ‰ํ•˜๋Š” ์ž‘์—…์€ ๊ณ„์‚ฐ์ ์œผ๋กœ ๋ถ€๋‹ด์ด ํฌ๊ณ  ์˜ค๋ฅ˜๊ฐ€ ๋ฐœ์ƒํ•˜๊ธฐ ์‰ฝ์Šต๋‹ˆ๋‹ค. ํšจ์œจ์ ์ด๊ณ  ์ •ํ™•ํ•œ ๊ฒ€์ƒ‰ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ๊ฐœ๋ฐœํ•˜๋Š” ๊ฒƒ์ด ์ฃผ์š” ๊ณผ์ œ์ž…๋‹ˆ๋‹ค.

  • ํ‰๊ฐ€์˜ ์–ด๋ ค์›€:

    ํŠนํžˆ RAG ์‹œ์Šคํ…œ์˜ ๊ตฌ์„ฑ ์š”์†Œ ์ˆ˜์ค€์—์„œ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ๊ฒƒ์€ ๋ณต์žกํ•œ ์ž‘์—…์ž…๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ ๊ฒ€์ƒ‰๊ณผ ์‘๋‹ต ์ƒ์„ฑ์˜ ํ’ˆ์งˆ์„ ์ •ํ™•ํžˆ ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒฌ๊ณ ํ•œ ํ‰๊ฐ€ ์ง€ํ‘œ๋ฅผ ๊ฐœ๋ฐœํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

RAG์˜ ์ธ๊ธฐ๋กœ ์ธํ•ด ์ด๋Ÿฌํ•œ ๊ณผ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ ๋‹ค์–‘ํ•œ ์—ฐ๊ตฌ์™€ ๋„๊ตฌ๋“ค์ด ๊ฐœ๋ฐœ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด ์„น์…˜์˜ ๋‚˜๋จธ์ง€ ๋ถ€๋ถ„์—์„œ๋Š” RAG๋ฅผ ๊ฐœ์„ ํ•˜๊ธฐ ์œ„ํ•œ ๊ฐ€์žฅ ์‹ค์šฉ์ ์ด๊ณ  ์˜ํ–ฅ๋ ฅ ์žˆ๋Š” ํ–ฅ์ƒ ๋ฐฉ์•ˆ์„ ์†Œ๊ฐœํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋˜ํ•œ RAG๋ฅผ ๋„˜์–ด ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๋Œ€์ฒด ๊ธฐ์ˆ  ์†”๋ฃจ์…˜์— ๋Œ€ํ•ด์„œ๋„ ๋…ผ์˜ํ•  ์˜ˆ์ •์ž…๋‹ˆ๋‹ค.

3.3 Retrieval-augmented Generation (RAG)

Retrieval-Augmented Generation (RAG)์€ ์–ธ์–ด ๋ชจ๋ธ์ด ์ƒ์„ฑ ๊ณผ์ •์—์„œ ์™ธ๋ถ€ ์ •๋ณด๋ฅผ ๋™์ ์œผ๋กœ ๊ฒ€์ƒ‰ํ•˜์—ฌ ์ž์—ฐ์–ด ์ƒ์„ฑ ๋Šฅ๋ ฅ์„ ๋ณด๊ฐ•ํ•˜๋Š” ๋ฐฉ๋ฒ•๋ก ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. ์ด ๊ธฐ์ˆ ์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์˜ ์ƒ์„ฑ ๋Šฅ๋ ฅ๊ณผ ๋ฐฉ๋Œ€ํ•œ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๋‚˜ ๋ฌธ์„œ์—์„œ ์ •๋ณด๋ฅผ ๊ฒ€์ƒ‰ํ•˜๋Š” ๊ธฐ๋Šฅ์„ ๊ฒฐํ•ฉํ•ฉ๋‹ˆ๋‹ค. ์ผ๋ฐ˜์ ์œผ๋กœ ์ด ๊ณผ์ •์€ ๋ฐ์ดํ„ฐ ์ธ๋ฑ์Šค ๊ตฌ์ถ•, ๊ฒ€์ƒ‰ ์‹œ์Šคํ…œ ๊ตฌ์„ฑ, ๊ทธ๋ฆฌ๊ณ  ์‘๋‹ต ์ƒ์„ฑ์˜ ๋‹จ๊ณ„๋ฅผ ๊ฑฐ์ณ ๊ตฌํ˜„๋ฉ๋‹ˆ๋‹ค.

3.3.1 Data Processing Enhancement

์ด ์ˆ˜์ค€์—์„œ Document Parsing์€ ํ…์ŠคํŠธ, ํ‘œ, ๋„ํ‘œ ๋“ฑ์—์„œ ์ •๋ณด๋ฅผ ์ผ๊ด€์„ฑ ์žˆ๊ฒŒ ์ถ”์ถœํ•˜๋ฉฐ, ๊ด€๋ จ ์žˆ๋Š” ์Šค๋‹ˆํŽซ์„ ์ •ํ™•ํžˆ ์‹๋ณ„ํ•˜๊ณ  ๊ฒ€์ƒ‰ํ•˜๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ๋กœ ํ•ฉ๋‹ˆ๋‹ค.

  • Multi-modal Document Parsing source document์— ํฌํ•จ๋œ ์ฐจํŠธ, ํ‘œ, ๋˜๋Š” ๋™์˜์ƒ(์˜ˆ: ํšŒ์˜ ๋…นํ™”)๊ณผ ๊ฐ™์€ multi-modal content๋ฅผ ์ฒ˜๋ฆฌํ•˜๋Š” ๊ฒƒ์€ ๊ฐ€์žฅ ์ž์ฃผ ์ œ๊ธฐ๋˜๋Š” ์งˆ๋ฌธ ์ค‘ ํ•˜๋‚˜์ž…๋‹ˆ๋‹ค. ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ๋‘ ๊ฐ€์ง€ ์ ‘๊ทผ๋ฒ•์ด ์ฃผ๋กœ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. ์ฒซ๋ฒˆ์งธ approach๋Š” multi-modal content๋ฅผ textual-form์œผ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, Table-to-Text ๋ฐฉ๋ฒ•์€ ํ‘œ๋ฅผ ํ…์ŠคํŠธ๋กœ ๋ณ€ํ™˜ํ•˜๋ฉฐ, ๋‹ค๋ฅธ ๊ธฐ์ˆ ๋“ค์€ ์‹œ๊ฐ์  ์ฝ˜ํ…์ธ ๋ฅผ ํ…์ŠคํŠธ ๋˜๋Š” ์†์„ฑ ๊ธฐ๋ฐ˜ ์„ค๋ช…์œผ๋กœ ๋ณ€ํ™˜ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ๋ณ€ํ™˜๋œ ๋ฐ์ดํ„ฐ๋Š” ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์—์„œ ์ฒ˜๋ฆฌ๋ฉ๋‹ˆ๋‹ค. ๋‘๋ฒˆ์งธ approach๋Š” multi-modal embedding์„ ํ™œ์šฉํ•˜์—ฌ multi-modal data์—์„œ ๊ฒ€์ƒ‰๋œ embedding์„ ์ž…๋ ฅ์„ ์œ„ํ•œ soft prompt๋กœ ์‚ฌ์šฉํ•œ๋‹ค.

  • Chunking Optimization ๊ธด ํ…์ŠคํŠธ์˜ ๊ฒฝ์šฐ ๋ฌธ์„œ๋ฅผ ํ…์ŠคํŠธ ์ฒญํฌ๋กœ ๋ถ„ํ• ํ•˜๋Š” ์ž‘์—…์€ ์ผ๋ฐ˜์ ์ด๊ณ  ํ•„์š”ํ•œ ์ž‘์—…์ž…๋‹ˆ๋‹ค. ํ…์ŠคํŠธ chunk๊ฐ€ ํด์ˆ˜๋ก ์ปจํ…์ŠคํŠธ์˜ ์˜๋ฏธ ์ผ๊ด€์„ฑ์„ ๋” ๋งŽ์ด ๋ณด์กดํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, ๊ฐ chunk ๋‚ด์— ๋” ๋งŽ์€ ๋…ธ์ด์ฆˆ๊ฐ€ ํฌํ•จ๋˜๋Š” ๊ฒฝํ–ฅ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์ผ๋ฐ˜์ ์œผ๋กœ ์‚ฌ์šฉ๋˜๋Š” Chunking Strategy์—๋Š” fixed-size chunking, recursive chunking, sliding window chunking, paragraph-based chunking, semantic chunking ๋“ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์ผ๋ถ€ ๋ฐฉ๋ฒ•์€ ์งˆ์˜๊ฐ€ ์š”๊ตฌํ•˜๋Š” ์„ธ๋ถ€ ์ˆ˜์ค€์„ ํŒŒ์•…ํ•œ ๋’ค, ์ด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ฒ€์ƒ‰์— ์ ํ•ฉํ•œ detailํ•œ ์ˆ˜์ค€์˜ ํ…์ŠคํŠธ chunk๋ฅผ ์„ ํƒํ•˜๋„๋ก ์„ค๊ณ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๋˜ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•์€ ํ…์ŠคํŠธ๋ฅผ ๋” ์ž‘์€ ์„ธ๊ทธ๋จผํŠธ๋กœ ๋‚˜๋ˆ„์–ด ์ •๋ณด ์™„์ „์„ฑ์„ ๋†’์€ ์ˆ˜์ค€์œผ๋กœ ์œ ์ง€ํ•˜๋„๋ก ์ฒ˜๋ฆฌํ•˜๊ณ  ์ •์ œํ•˜๋Š” ๋ฐฉ์‹์„ ์ฑ„ํƒํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ ๋น„์ „ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์—ฌ ์›๋ณธ ๋ฌธ์„œ ๊ตฌ์กฐ์— ๋”ฐ๋ผ ํ…์ŠคํŠธ๋ฅผ ๋ถ„ํ• ํ•˜๋Š” ์ ‘๊ทผ ๋ฐฉ์‹๋„ ์žˆ์Šต๋‹ˆ๋‹ค.

3.3.2 Data Retrieval Enhancement

์ •๋ณด ๊ฒ€์ƒ‰(IR) ๊ธฐ์ˆ ์€ RAG ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์— ์›ํ™œํ•˜๊ฒŒ ์ ์šฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ฃผ์š” ๋‹จ๊ณ„์—๋Š” ๋ฐ์ดํ„ฐ ์ธ๋ฑ์Šค ์„ค์ •, ์งˆ์˜ ์ฒ˜๋ฆฌ, retrieving ๋ฐ matching, re-ranking, evaluation์ด ํฌํ•จ๋ฉ๋‹ˆ๋‹ค.

Indexing : ์ด ๋‹จ๊ณ„์˜ ๋ชฉ์ ์€ ๊ฒ€์ƒ‰์–ด์™€ ํ…์ŠคํŠธ ์„ธ๊ทธ๋จผํŠธ๋ฅผ ์—ฐ๊ฒฐํ•˜๋Š” ๋งคํ•‘์„ ์„ค์ •ํ•˜๊ณ , ๊ฒ€์ƒ‰ ์‹œ์Šคํ…œ์ด ์ž‘๋™ํ•˜๋Š” ๋…ผ๋ฆฌ๋ฅผ ๊ฒฐ์ •ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ธ๋ฑ์‹ฑ ๋ฐฉ๋ฒ•์€ ํฌ๊ฒŒ ์„ธ ๊ฐ€์ง€๋กœ ๋ถ„๋ฅ˜๋ฉ๋‹ˆ๋‹ค: ํฌ์†Œ(sparse), ๋ฐ€์ง‘(dense), ํ˜ผํ•ฉ(hybrid) ๊ฒ€์ƒ‰. ํฌ์†Œ ๊ฒ€์ƒ‰(Sparse Retrieval)๋Š” ํŠน์ • ๋‹จ์–ด๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ํ…์ŠคํŠธ ์„ธ๊ทธ๋จผํŠธ๋ฅผ ์ธ๋ฑ์‹ฑํ•ฉ๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด, ๋ฐ€์ง‘ ๊ฒ€์ƒ‰(Dense Retrieval)์€ ํ…์ŠคํŠธ ์„ธ๊ทธ๋จผํŠธ๋ฅผ ํŠน์ง•์˜ ๋ฐ€์ง‘ ๋ฒกํ„ฐ ๊ณต๊ฐ„์— ๋งคํ•‘ํ•ฉ๋‹ˆ๋‹ค. ํ˜ผํ•ฉ ๊ฒ€์ƒ‰(Hybrid Retrieval)์€ ํฌ์†Œ ๊ฒ€์ƒ‰๊ณผ ๋ฐ€์ง‘ ๊ฒ€์ƒ‰์˜ ์š”์†Œ๋ฅผ ๊ฒฐํ•ฉํ•œ ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค.

  • ํฌ์†Œ ๊ฒ€์ƒ‰(Sparse Retrieval) : ์ด ๋ฐฉ์‹์€ ๊ฐ„๋‹จํ•˜๊ณ  ์ง๊ด€์ ์ด๊ธฐ ๋•Œ๋ฌธ์— ์ฒ˜์Œ์œผ๋กœ ๋„๋ฆฌ ์ฑ„ํƒ๋œ ์ธ๋ฑ์‹ฑ ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค. TF-IDF์™€ BM25์™€ ๊ฐ™์€ ๊ธฐ์ˆ ์€ ๊ฐ ํ…์ŠคํŠธ ์„ธ๊ทธ๋จผํŠธ์˜ ์ƒ๋Œ€์ ์ธ ๋นˆ๋„๋ฅผ ๊ธฐ์ค€์œผ๋กœ ๊ฐ€์žฅ ๋Œ€ํ‘œ์ ์ธ ํ‚ค์›Œ๋“œ๋ฅผ ์‹๋ณ„ํ•˜๋„๋ก ์„ค๊ณ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฐฉ๋ฒ•์€ ์—ฌ์ „ํžˆ ๋งŽ์€ RAG ํ”„๋กœ์ ํŠธ์—์„œ ๋„๋ฆฌ ์‚ฌ์šฉ๋˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๋‹จ์–ด ๋งค์นญ ๋ฐฉ์‹์€ ๋™์˜์–ด๋ฅผ ์ธ์‹ํ•˜์ง€ ๋ชปํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๊ฒ€์ƒ‰ ์†์‹ค์ด ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด KNN๊ณผ ๊ฐ™์€ ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ•˜์—ฌ ํ‚ค์›Œ๋“œ์˜ ์œ ์‚ฌ์„ฑ ๊ธฐ๋ฐ˜ ๋งค์นญ์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜๋Š” ํ‚ค์›Œ๋“œ์™€ ๊ฐ™์€ ์ธ๋ฑ์Šค๋ฅผ ๋ณ€๊ฒฝํ•˜์—ฌ ํ•ด๋‹น ํ…์ŠคํŠธ ์„ธ๊ทธ๋จผํŠธ์— ๋Œ€ํ•œ ์งˆ์˜ ํ† ํฐ์˜ ํ™•๋ฅ ์„ ์˜ˆ์ธกํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ์ „ํ™˜ํ•  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค.

  • ๋ฐ€์ง‘ ๊ฒ€์ƒ‰(Dense Retrieval) : ์ด ๋ฐฉ์‹์€ ์ฃผ๋กœ ์‚ฌ์ „ ํ•™์Šต๋˜์—ˆ๊ฑฐ๋‚˜ ์„ธ๋ถ„ํ™”๋œ ํ…์ŠคํŠธ ์ธ์ฝ”๋”๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ํ…์ŠคํŠธ๋ฅผ ์งˆ์˜ ์š”๊ตฌ์‚ฌํ•ญ์— ๋งž๋Š” ๋ฐ€์ง‘ ๋ฒกํ„ฐ ๊ณต๊ฐ„์œผ๋กœ ๋งคํ•‘ํ•˜๋Š” ๊ฒƒ์„ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค. BERT ๊ธฐ๋ฐ˜ ์ธ์ฝ”๋”๋Š” ์ข…์ข… DPR, ANCE, SimCSE, TAS-B์™€ ๊ฐ™์€ ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ•˜์—ฌ ๋น„์ง€๋„ ๋ฐ์ดํ„ฐ์—์„œ ๋ฐ€์ง‘ ๊ฒ€์ƒ‰๊ธฐ๋กœ fine tuning ๋ฉ๋‹ˆ๋‹ค. ๋˜ ๋‹ค๋ฅธ ์ ‘๊ทผ๋ฒ•์œผ๋กœ๋Š” Contriever์™€ ๊ฐ™์€ unsupervised contrastive learning์„ ํ†ตํ•ด fine tuning์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ฐฉ์‹์ด ์žˆ์Šต๋‹ˆ๋‹ค. LLM๋กœ๋ถ€ํ„ฐ ํ”ผ๋“œ๋ฐฑ์„ ๋ฐ›์•„ ๊ฒ€์ƒ‰๊ธฐ์˜ ํ•™์Šต ๋ชฉํ‘œ๋ฅผ ์•ˆ๋‚ดํ•˜๋ฉด ๊ฒ€์ƒ‰๊ธฐ๊ฐ€ LLM์— ๋” ์ ํ•ฉํ•˜๋„๋ก ํšจ๊ณผ์ ์œผ๋กœ ๊ฐœ์„ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. LLM์˜ ๊ฐ•๋ ฅํ•œ ๋Šฅ๋ ฅ๊ณผ ํ‘œํ˜„ ๊ฐ€๋Šฅ์„ฑ ๋•๋ถ„์— ์ตœ๊ทผ์—๋Š” LLM ๊ธฐ๋ฐ˜ ๋ฐ€์ง‘ ๊ฒ€์ƒ‰์ด ์ฃผ์š” ๊ด€์‹ฌ ์˜์—ญ์œผ๋กœ ๋– ์˜ค๋ฅด๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. LLM2vec๋Š” ์‚ฌ์ „ ํ•™์Šต๋œ LLM์˜ ์–ดํ…์…˜ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ์–‘๋ฐฉํ–ฅ์œผ๋กœ ์ˆ˜์ •ํ•˜๊ณ , ๋งˆ์Šคํ‚น๋œ ๋‹ค์Œ ํ† ํฐ ์˜ˆ์ธก ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ•˜์—ฌ ๋น„์ง€๋„ ํ•™์Šต์„ ์ˆ˜ํ–‰ํ•จ์œผ๋กœ์จ LLM ๊ธฐ๋ฐ˜์˜ ๋ฐ€์ง‘ ๊ฒ€์ƒ‰ ์ž„๋ฒ ๋”๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ, Llama2Vec๋Š” LLaMA ์•„ํ‚คํ…์ฒ˜๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋‘ ๊ฐ€์ง€ ์‚ฌ์ „ ์ž‘์—…(์ž„๋ฒ ๋”ฉ ๊ธฐ๋ฐ˜ ์ž๋™ ์ธ์ฝ”๋”ฉ ๋ฐ ์ž„๋ฒ ๋”ฉ ๊ธฐ๋ฐ˜ ์ž๋™ ํšŒ๊ท€)์„ ํ™œ์šฉํ•˜์—ฌ ๋น„์ง€๋„ ๋ฐ€์ง‘ ๊ฒ€์ƒ‰ ์ธ์ฝ”๋”๋ฅผ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๊ฒ€์ƒ‰ ์ž‘์—… ์„ฑ๋Šฅ์ด ํฌ๊ฒŒ ํ–ฅ์ƒ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

  • ๊ธฐํƒ€(Others) : ํฌ์†Œ ๊ฒ€์ƒ‰๊ณผ ๋ฐ€์ง‘ ๊ฒ€์ƒ‰์„ ๊ฒฐํ•ฉํ•˜๋Š” ๊ฒƒ์€ ํ…์ŠคํŠธ ์„ธ๊ทธ๋จผํŠธ์˜ ํ•ต์‹ฌ ์ฃผ์ œ์™€ ์ „๋ฐ˜์ ์ธ ํŠน์ง•์„ ๋™์‹œ์— ์ง‘์ค‘ํ•  ์ˆ˜ ์žˆ๋Š” ํšจ๊ณผ์ ์ธ ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค. Feng ๋“ฑ(2023)์€ ์งˆ์˜์— ๋‹ต๋ณ€ํ•˜๊ธฐ ์œ„ํ•ด ํ•„์š”ํ•œ ์ง€์‹ ๋„๋ฉ”์ธ์„ ๋จผ์ € ๊ณ ์ •๋œ ์ „๋ฌธ ์˜์—ญ์œผ๋กœ ๊ฒฐ์ •ํ•œ ๋‹ค์Œ, ์ด ๋„๋ฉ”์ธ ๋‚ด์—์„œ ๋ฐ€์ง‘ ๊ฒ€์ƒ‰์„ ์‚ฌ์šฉํ•ด ๋ณด์กฐ ์ •๋ณด๋ฅผ ๊ฒ€์ƒ‰ํ•˜๋Š” ๋ฐฉ์‹์„ ์ œ์•ˆํ–ˆ์Šต๋‹ˆ๋‹ค. ์—ฌ๋Ÿฌ ์—ฐ๊ตฌ์—์„œ๋Š” ๋ฐ€์ง‘ ๋ฒกํ„ฐ ์ธ๋ฑ์‹ฑ๊ณผ ํฌ์†Œ ์ธ์ฝ”๋” ์ธ๋ฑ์‹ฑ์„ ๊ฒฐํ•ฉํ•˜์—ฌ ํ…์ŠคํŠธ ๋ธ”๋ก์˜ ์˜๋ฏธ ์ •๋ณด๋ฅผ ๋” ์ž˜ ํฌ์ฐฉํ•˜๊ณ , ๋ชฉํ‘œ ๋‹จ๋ฝ ๊ฒ€์ƒ‰์˜ ์ •ํ™•๋„๋ฅผ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ๋‹ค์–‘ํ•œ ๋ฐฉ๋ฒ•์„ ํƒ๊ตฌํ•ด ์™”์Šต๋‹ˆ๋‹ค. ํ•œํŽธ, Tang ๋“ฑ(2024)์€ LLM์˜ ์ธ๋ฑ์‹ฑ ๋ฐ ๊ฒ€์ƒ‰ ๋Šฅ๋ ฅ์„ ๋ฏธ์„ธ ์กฐ์ •ํ•˜์—ฌ ์ด๋Ÿฌํ•œ ๊ธฐ๋Šฅ์„ LLM์— ์ง์ ‘ ํ†ตํ•ฉํ•˜๋Š” ๋ฐฉ์‹์„ ๊ฐœ์„ ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด LLM์ด ๊ฐ ์งˆ์˜์— ๋Œ€ํ•ด ์ž์œจ์ ์œผ๋กœ ๋ฐ์ดํ„ฐ ์ธ๋ฑ์Šค์™€ ํ…์ŠคํŠธ ์„ธ๊ทธ๋จผํŠธ๋ฅผ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ๋„๋ก ํ–ˆ์Šต๋‹ˆ๋‹ค.

Query Document Alignment : ์ด ๋‹จ๊ณ„์˜ ๋ชฉํ‘œ๋Š” ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ์—์„œ ์งˆ์˜์™€ ๋ฌธ์„œ ์„ธ๊ทธ๋จผํŠธ๋ฅผ ์ผ์น˜์‹œ์ผœ, ์งˆ์˜์— ๋‹ต๋ณ€ํ•˜๋Š” ๋ฐ ๊ฐ€์žฅ ์ ํ•ฉํ•œ ๋ฌธ์„œ ์„ธ๊ทธ๋จผํŠธ๋ฅผ ์‹๋ณ„ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. Figure 03์—์„œ ์„ค๋ช…๋œ ๊ฒƒ์ฒ˜๋Ÿผ, ์ด๋Ÿฌํ•œ alignment์—๋Š” ์ฃผ๋กœ 3๊ฐ€์ง€ ์ ‘๊ทผ ๋ฐฉ์‹์ด ์žˆ์Šต๋‹ˆ๋‹ค: ์ „ํ†ต์  ์ •๋ ฌ(traditional alignment), ๋ฌธ์„œ ๋„๋ฉ”์ธ ์ •๋ ฌ(document domain alignment), ์งˆ์˜ ๋„๋ฉ”์ธ ์ •๋ ฌ(query domain alignment)์ž…๋‹ˆ๋‹ค. ์ „ํ†ต์  ์ •๋ ฌ(Traditional Alignment)์€ ๋ฌธ์„œ ์„ธ๊ทธ๋จผํŠธ์™€ ์งˆ์˜๋ฅผ ๋™์ผํ•œ ์ธ์ฝ”๋”ฉ ๊ณต๊ฐ„์œผ๋กœ ๋งคํ•‘ํ•˜๋Š” ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๋“€์–ผ ์ธ์ฝ”๋” ๊ธฐ๋ฐ˜์˜ ๋งŽ์€ ๋ฐ€์ง‘ ๊ฒ€์ƒ‰ ์•„ํ‚คํ…์ฒ˜๋Š” ํŠนํ™”๋œ ์งˆ์˜ ์ธ์ฝ”๋”๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ํŠน์ง•์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋Œ€๋กœ, RAG์™€ ๊ฐ™์€ ์‹œ์Šคํ…œ์ด ํฌ์†Œ ๊ฒ€์ƒ‰์„ ์‚ฌ์šฉํ•˜๋Š” ๊ฒฝ์šฐ, ๊ฒ€์ƒ‰์„ ์œ„ํ•ด ์งˆ์˜์—์„œ ํ‚ค์›Œ๋“œ๋ฅผ ์ถ”์ถœํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๊ฒ€์ƒ‰ ์ •ํ™•๋„๋ฅผ ๋”์šฑ ๊ฐœ์„ ํ•˜๊ธฐ ์œ„ํ•ด ์งˆ์˜ ์žฌ์ž‘์„ฑ (query rewriting) ๊ธฐ์ˆ ์„ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์‚ฌ์šฉ์ž ์šฉ์–ด์˜ ๋ถ€์ •ํ™•์„ฑ์ด๋‚˜ ๋ชจํ˜ธํ•œ ์„ค๋ช…๊ณผ ๊ด€๋ จ๋œ ๋ฌธ์ œ๋ฅผ ์™„ํ™”ํ•˜์—ฌ ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ์˜ ์ •๋ฐ€๋„๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค. ๋ฌธ์„œ ๋„๋ฉ”์ธ ์ •๋ ฌ (Document Domain Alignment)์€ ๋จผ์ € ํ•ฉ์„ฑ ๋‹ต๋ณ€(synthetic answer)์„ ์ƒ์„ฑํ•œ ๋‹ค์Œ, ์ด๋Ÿฌํ•œ ๋‹ต๋ณ€์„ ์‚ฌ์šฉํ•˜์—ฌ ๊ด€๋ จ ๋ฐ์ดํ„ฐ๋ฅผ ๊ฒ€์ƒ‰ํ•˜๋Š” ๋ฐฉ์‹์„ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ์งˆ์˜์™€ ๊ฒ€์ƒ‰๋œ ๋ฐ์ดํ„ฐ๊ฐ€ ๋™์ผํ•œ ๋ถ„ํฌ ๊ณต๊ฐ„์— ์žˆ์ง€ ์•Š์€ ๋ฌธ์ œ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ๋ถ„์•ผ์—์„œ ์ฃผ๋ชฉํ•  ๋งŒํ•œ ์—ฐ๊ตฌ๋Š” HyDE์ž…๋‹ˆ๋‹ค. ์งˆ์˜ ๋„๋ฉ”์ธ ์ •๋ ฌ(Query Domain Alignment)์€ ๊ฐ ํ…์ŠคํŠธ์˜ ์›์ž์  ๋‹จ์œ„์— ๋Œ€ํ•ด ํ•ฉ์„ฑ ์งˆ๋ฌธ ์„ธํŠธ๋ฅผ ์ƒ์„ฑํ•˜๊ณ , ํ…์ŠคํŠธ ์„ธ๊ทธ๋จผํŠธ๋ฅผ ์งˆ์˜ ๊ณต๊ฐ„์œผ๋กœ ๋งคํ•‘ํ•œ ๋‹ค์Œ, ์›๋ž˜ ์งˆ์˜์™€ ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด ํ•ฉ์„ฑ ์งˆ๋ฌธ๊ณผ ํ•ด๋‹น ํ…์ŠคํŠธ ์„ธ๊ทธ๋จผํŠธ๋ฅผ ๊ฒ€์ƒ‰ํ•˜๋Š” ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค. ์ด ๋ฐฉ๋ฒ•์€ ์งˆ์˜์— ๋‹ต๋ณ€ํ•˜๊ธฐ ์œ„ํ•ด ๊ฐ€์žฅ ๊ด€๋ จ ์žˆ๊ณ  ๋งฅ๋ฝ์ ์œผ๋กœ ์ ํ•ฉํ•œ ์„ธ๊ทธ๋จผํŠธ๋ฅผ ์„ ํƒํ•  ์ˆ˜ ์žˆ๋„๋ก ๋ณด์žฅํ•ฉ๋‹ˆ๋‹ค. SlimPLM์€ ์†Œ๊ทœ๋ชจ ํ”„๋ก์‹œ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์—ฌ ํœด๋ฆฌ์Šคํ‹ฑ ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•˜๊ณ , ์ด๋ฅผ ํ†ตํ•ด ์งˆ๋ฌธ์— ๋‹ต๋ณ€ํ•˜๋Š” ๋ฐ ํ•„์š”ํ•œ ์ง€์‹์„ ์˜ˆ์ธกํ•ฉ๋‹ˆ๋‹ค. ์ด ์ ‘๊ทผ๋ฒ•์€ ์งˆ์˜๋ฅผ ๋ฌธ์„œ ๊ณต๊ฐ„์— ์ •๋ ฌํ•˜๋Š” ํšจ๊ณผ์ ์ธ ๋ฐฉ๋ฒ•์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

3.3.3 Response Generation Enhancement

์‘๋‹ต์„ ์ƒ์„ฑํ•˜๋ ค๋ฉด ๊ฒ€์ƒ‰๋œ ์ •๋ณด๊ฐ€ ์ถฉ๋ถ„ํ•œ์ง€, ์ถ”๊ฐ€์ ์ธ ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๊ฐ€ ํ•„์š”ํ•œ์ง€๋ฅผ ํŒ๋‹จํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ, ๊ฒ€์ƒ‰๋œ ์ง€์‹๊ณผ ๋ชจ๋ธ์˜ ๋‚ด์žฌ๋œ ์‚ฌ์ „ ์ง€์‹ ๊ฐ„์˜ ์ถฉ๋Œ์„ ์ฒ˜๋ฆฌํ•˜๋Š” ๊ฒƒ๋„ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ์ง€๋„ ํ•™์Šต ๊ธฐ๋ฐ˜ ๋ฏธ์„ธ ์กฐ์ •(Supervised Fine-Tuning)์€ RAG ์‹œ์Šคํ…œ์—์„œ ์‘๋‹ต ์ƒ์„ฑ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ํšจ๊ณผ์ ์ธ ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค.

๊ฒ€์ƒ‰๋œ ๋ฌธ๋งฅ์ด ๋ถ€์ ์ ˆํ•˜๊ฑฐ๋‚˜ ์ž˜๋ชป๋œ ์ •๋ณด์ธ ๊ฒฝ์šฐ, ์‚ฌ์ „ ํ•™์Šต๋œ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์€ ์‰ฝ๊ฒŒ ์˜ค๋„๋˜์–ด ์ž˜๋ชป๋œ ์‘๋‹ต์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋งŽ์€ ์—ฐ๊ตฌ๋Š” RAG ์‹œ์Šคํ…œ์˜ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๋ฅผ ์‹ ์ค‘ํ•˜๊ฒŒ ์„ค๊ณ„ํ•จ์œผ๋กœ์จ, ๋ฏธ์„ธ ์กฐ์ • ๋˜๋Š” ์‚ฌ์ „ ํ•™์Šต์„ ํ†ตํ•ด ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ์™„ํ™”ํ•  ์ˆ˜ ์žˆ์Œ์„ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค.

RAAT๋Š” ์‹คํ—˜์  ๋ถ„์„์„ ํ†ตํ•ด, ๊ด€๋ จ ์—†๋Š” ๊ฒ€์ƒ‰ ๋…ธ์ด์ฆˆ, ๊ด€๋ จ ์žˆ๋Š” ๊ฒ€์ƒ‰ ๋…ธ์ด์ฆˆ, ๊ทธ๋ฆฌ๊ณ  ๋ฐ˜์‚ฌ์‹ค์ (counterfactual) ๊ฒ€์ƒ‰ ๋…ธ์ด์ฆˆ๊ฐ€ RAG ๋ชจ๋ธ์— ๋ฏธ์น˜๋Š” ๋ถ€์ •์ ์ธ ํšจ๊ณผ๊ฐ€ ์ ์ง„์ ์œผ๋กœ ์ฆ๊ฐ€ํ•จ์„ ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ํ›ˆ๋ จ ๊ณผ์ •์„ ํ†ตํ•ฉํ•จ์œผ๋กœ์จ, LLM์€ ๋‚ด๋ถ€์ ์œผ๋กœ ๋…ธ์ด์ฆˆ๊ฐ€ ์žˆ๋Š” ๋ฌธ๋งฅ์„ ์ธ์‹ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋˜์–ด, ๋…ธ์ด์ฆˆ๊ฐ€ ์žˆ๋Š” ๊ฒ€์ƒ‰ ์ƒํ™ฉ์—์„œ๋„ ์‘๋‹ต ์ƒ์„ฑ ํ’ˆ์งˆ์ด ํฌ๊ฒŒ ํ–ฅ์ƒ๋ฉ๋‹ˆ๋‹ค. ๋” ๋‚˜์•„๊ฐ€, RAG ์‹œ์Šคํ…œ ๋‚ด์—์„œ ๊ฒ€์ƒ‰๊ธฐ(retriever)์™€ ์ƒ์„ฑ๊ธฐ(generator) ๊ฐ„์˜ ์„ฑ๋Šฅ ์ผ๊ด€์„ฑ์„ ๋ณด์žฅํ•˜๊ธฐ ์œ„ํ•ด, ์ผ๋ถ€ ์—ฐ๊ตฌ์—์„œ๋Š” ํ•™์Šต ๋‹จ๊ณ„์—์„œ ๊ฒ€์ƒ‰๊ธฐ์™€ ์ƒ์„ฑ๊ธฐ๋ฅผ ๊ณต๋™์œผ๋กœ ํ›ˆ๋ จํ•˜๋Š” ๋ฐฉ์‹์„ ์ฑ„ํƒํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

4. Implicit Fact Queries (L2)

4.1 Overview

์ด๋Ÿฌํ•œ ์งˆ์˜๋Š” ์ฆ‰๊ฐ์ ์œผ๋กœ ๋ช…ํ™•ํ•˜์ง€ ์•Š์€ ๋ฐ์ดํ„ฐ ์˜์กด์„ฑ์„ ํฌํ•จํ•˜๋ฉฐ, ์ผ์ • ์ˆ˜์ค€์˜ ์ƒ์‹์  ์ถ”๋ก ์ด๋‚˜ ๊ธฐ๋ณธ์ ์ธ ๋…ผ๋ฆฌ์  ์œ ์ถ”๊ฐ€ ํ•„์š”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํ•„์š”ํ•œ ์ •๋ณด๋Š” ์—ฌ๋Ÿฌ ์„ธ๊ทธ๋จผํŠธ์— ๋ถ„์‚ฐ๋˜์–ด ์žˆ์„ ์ˆ˜๋„ ์žˆ๊ณ , ๊ฐ„๋‹จํ•œ ์ถ”๋ก ์„ ์š”๊ตฌํ•  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค. (์˜ˆ์‹œ๋Š” Figure 02 ์ฐธ์กฐ)

์ด ์ˆ˜์ค€์˜ ์งˆ์˜๋Š” ์ปฌ๋ ‰์…˜ ๋‚ด ์—ฌ๋Ÿฌ ๋ฌธ์„œ์—์„œ ์ •๋ณด๋ฅผ ์ˆ˜์ง‘ํ•˜๊ณ  ์ฒ˜๋ฆฌํ•˜๋Š” ์ž‘์—…์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ํ•„์š”ํ•œ ์ •๋ณด์˜ ์–‘์ด ๋‹จ์ผ ๊ฒ€์ƒ‰ ์š”์ฒญ์˜ ๋ฒ”์œ„๋ฅผ ์ดˆ๊ณผํ•  ์ˆ˜ ์žˆ์–ด, ์›๋ž˜ ์งˆ์˜๋ฅผ ์—ฌ๋Ÿฌ ๊ฒ€์ƒ‰ ์ž‘์—…์œผ๋กœ ๋ถ„ํ•ดํ•˜๊ณ  ๊ฒฐ๊ณผ๋ฅผ ์ข…ํ•ฉํ•˜์—ฌ ํฌ๊ด„์ ์ธ ๋‹ต๋ณ€์„ ๊ตฌ์„ฑํ•ด์•ผ ํ•  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ์ˆ˜์ค€์€ ๋„๋ฉ”์ธ๋ณ„ ์ „๋ฌธ ์ง€์‹ ์—†์ด๋„ ์ƒ์‹์  ์ถ”๋ก ์ด ์ž์ฃผ ์š”๊ตฌ๋ฉ๋‹ˆ๋‹ค.

  • ์‹คํ—˜ ๊ธฐ๋ก ๋ชจ์Œ์ด ์ฃผ์–ด์กŒ์„ ๋•Œ, ์ƒ˜ํ”Œ ํฌ๊ธฐ๊ฐ€ 1000๊ฐœ๋ฅผ ์ดˆ๊ณผํ•˜๋Š” ์‹คํ—˜์€ ๋ช‡ ๊ฐœ์ž…๋‹ˆ๊นŒ?

  • ์˜๋ฃŒ ๊ธฐ๋ก ๋ชจ์Œ์ด ์ฃผ์–ด์กŒ์„ ๋•Œ, ๊ฐ€์žฅ ์ž์ฃผ ์–ธ๊ธ‰๋œ ์ฆ์ƒ 3๊ฐ€์ง€๋Š” ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

  • ํšŒ์‚ฌ X์™€ ํšŒ์‚ฌ Y์˜ AI ์ „๋žต์˜ ์ฐจ์ด์ ์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ? (ํšŒ์‚ฌ X์™€ Y์— ๋Œ€ํ•œ ์ตœ์‹  ๋‰ด์Šค์™€ ๊ธฐ์‚ฌ ๋ชจ์Œ์ด ์ฃผ์–ด์ง„ ๊ฒฝ์šฐ)

4.2 Challenges and Solutions

์ด ์ˆ˜์ค€์˜ ์งˆ์˜๋Š” ์—ฌ์ „ํžˆ ์‚ฌ์‹ค ๊ธฐ๋ฐ˜ ์งˆ๋ฌธ์„ ์ค‘์‹ฌ์œผ๋กœ ์ด๋ฃจ์–ด์ง€์ง€๋งŒ, ๋‹ต๋ณ€์ด ๋‹จ์ผ ํ…์ŠคํŠธ ๊ตฌ์ ˆ์— ๋ช…์‹œ์ ์œผ๋กœ ์ œ์‹œ๋˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๋Œ€์‹ , ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ์‚ฌ์‹ค์„ ๊ฒฐํ•ฉํ•˜๊ณ  ์ƒ์‹์ ์ธ ์ถ”๋ก ์„ ํ†ตํ•ด ๊ฒฐ๋ก ์— ๋„๋‹ฌํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๋ ˆ๋ฒจ 2 ์งˆ์˜์˜ ์ฃผ์š” ๋„์ „ ๊ณผ์ œ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:

  • Adaptive Retrieval Volumes : ์งˆ๋ฌธ์— ๋”ฐ๋ผ ๊ฒ€์ƒ‰ํ•ด์•ผ ํ•˜๋Š” ๋ฌธ๋งฅ์˜ ์ˆ˜๊ฐ€ ๋‹ค๋ฅผ ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๊ฒ€์ƒ‰ํ•ด์•ผ ํ•  ๋ฌธ๋งฅ์˜ ์ •ํ™•ํ•œ ์ˆ˜๋Š” ์งˆ๋ฌธ๊ณผ ๋ฐ์ดํ„ฐ์…‹ ๋ชจ๋‘์— ๋”ฐ๋ผ ๋‹ฌ๋ผ์งˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ณ ์ •๋œ ๊ฒ€์ƒ‰ ํšŸ์ˆ˜๋ฅผ ์„ค์ •ํ•˜๋ฉด ์ •๋ณด ๊ณผ์ž‰(๋…ธ์ด์ฆˆ)์ด ๋ฐœ์ƒํ•˜๊ฑฐ๋‚˜ ์ •๋ณด๊ฐ€ ๋ถ€์กฑํ•  ๊ฐ€๋Šฅ์„ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค.

  • Coordination between reasoning and retrieval : ์ถ”๋ก ์€ ๊ฒ€์ƒ‰ํ•ด์•ผ ํ•  ์ •๋ณด์˜ ์ดˆ์ ์„ ์•ˆ๋‚ดํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๊ฒ€์ƒ‰๋œ ์ •๋ณด์—์„œ ์–ป์€ ํ†ต์ฐฐ์€ ์ถ”๋ก  ์ „๋žต์„ ๋ฐ˜๋ณต์ ์œผ๋กœ ๊ฐœ์„ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ณต์žก์„ฑ์„ ํ•ด๊ฒฐํ•˜๋ ค๋ฉด ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๋ฅผ ์ง€๋Šฅ์ ์œผ๋กœ ํ†ตํ•ฉํ•˜๊ณ  ์„ ๋ณ„์ ์œผ๋กœ ํ™œ์šฉํ•˜๋ฉฐ, LLM(๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ)์˜ ๋‚ด์žฌ๋œ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ์ตœ๋Œ€ํ•œ ํ™œ์šฉํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

์ด ์ˆ˜์ค€์˜ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ ๋ฐฉ๋ฒ•์œผ๋กœ๋Š” ๋ฐ˜๋ณต์ ์ธ RAG(์ถ”๋ก ๊ณผ ๊ฒ€์ƒ‰ ๊ฒฐํ•ฉ), ๊ทธ๋ž˜ํ”„/ํŠธ๋ฆฌ ๊ธฐ๋ฐ˜ RAG, SQL ๊ธฐ๋ฐ˜ RAG ๋“ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค.

4.3 Iterative RAG

์•”์‹œ์  ์‚ฌ์‹ค ์งˆ์˜๋Š” Multi-Hop RAG(์ถ”๋ก ๊ณผ ๊ฒ€์ƒ‰ ๊ฒฐํ•ฉ) ์ž‘์—…๊ณผ ์œ ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ์ด ๋ฐฉ๋ฒ• ์นดํ…Œ๊ณ ๋ฆฌ๋Š” ๋‹ค๋‹จ๊ณ„ RAG ํ”„๋กœ์„ธ์Šค๋ฅผ ๋™์ ์œผ๋กœ ์ œ์–ดํ•˜๋ฉฐ, ์˜ฌ๋ฐ”๋ฅธ ๋‹ต๋ณ€์— ๋„๋‹ฌํ•  ๋•Œ๊นŒ์ง€ ๋ฐ˜๋ณต์ ์œผ๋กœ ์ •๋ณด๋ฅผ ์ˆ˜์ง‘ํ•˜๊ฑฐ๋‚˜ ์ˆ˜์ •ํ•ฉ๋‹ˆ๋‹ค.

  • Planning-based : ๊ฒ€์ƒ‰ ์ด์ „ ๋‹จ๊ณ„์—์„œ ๋‹จ๊ณ„๋ณ„ ๊ฒ€์ƒ‰ ๊ณ„ํš์„ ์ƒ์„ฑํ•˜๊ฑฐ๋‚˜, ๊ฒ€์ƒ‰ ๊ณผ์ • ์ค‘ ๋™์ ์œผ๋กœ ๊ณ„ํš์„ ์ƒ์„ฑํ•˜์—ฌ ๊ฐ ๊ฒ€์ƒ‰์˜ ์ดˆ์ ์„ ์„ธ๋ถ„ํ™”ํ•˜๊ณ , ๋ฐ˜๋ณต์ ์ธ RAG ์‹œ์Šคํ…œ์„ ํšจ์œจ์ ์œผ๋กœ ์•ˆ๋‚ดํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ReAct [93]๋Š” ๊ฐ ๋‹จ๊ณ„์˜ ๋ชฉํ‘œ๋ฅผ ์ ์ง„์ ์œผ๋กœ ์—…๋ฐ์ดํŠธํ•˜์—ฌ ์งˆ๋ฌธ์— ๋‹ตํ•˜๊ธฐ ์œ„ํ•ด ํ•„์š”ํ•œ ์ง€์‹ ๊ฒฉ์ฐจ๋ฅผ ์ค„์ž…๋‹ˆ๋‹ค. IRCoT [94]์™€ RAT [95]๋Š” ์—ฐ์‡„์  ์‚ฌ๊ณ (Chain of Thought)๋ฅผ ํ™œ์šฉํ•ด RAG ํŒŒ์ดํ”„๋ผ์ธ์„ ์•ˆ๋‚ดํ•˜๋ฉฐ, ์ด์ „์— ํšŒ์ƒํ•œ ์ •๋ณด์— ๊ธฐ๋ฐ˜ํ•ด ํ˜„์žฌ ๊ฒ€์ƒ‰ ๋ชฉํ‘œ๋ฅผ ๊ฒฐ์ •ํ•ฉ๋‹ˆ๋‹ค. GenGround [96]์€ LLM(๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ)์ด ์ตœ์ข… ๋‹ต๋ณ€์— ๋„๋‹ฌํ•  ๋•Œ๊นŒ์ง€ ๋‘ ๋‹จ๊ณ„๋ฅผ ๋ฐ˜๋ณตํ•˜๋„๋ก ํ•ฉ๋‹ˆ๋‹ค: (1) ๋” ๋‹จ์ˆœํ•œ ๋‹จ์ผ ๋‹จ๊ณ„ ์งˆ๋ฌธ์„ ์ƒ์„ฑํ•˜๊ณ  ์ง์ ‘์ ์ธ ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•˜๋Š” ๋‹จ๊ณ„, (2) ์งˆ๋ฌธ-๋‹ต๋ณ€ ์Œ์„ ๊ฒ€์ƒ‰๋œ ๋ฌธ์„œ๋กœ ๋‹ค์‹œ ์ถ”์ ํ•˜์—ฌ ์˜ˆ์ธก์˜ ๋ถ€์ •ํ™•์„ฑ์„ ํ™•์ธํ•˜๊ณ  ์ˆ˜์ •ํ•˜๋Š” ๋‹จ๊ณ„. ์ด๋Ÿฌํ•œ ๋ฐ˜๋ณต์ ์ธ ํ”„๋กœ์„ธ์Šค๋Š” ๋” ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๊ณ  ์ •ํ™•ํ•œ ์‘๋‹ต์„ ๋ณด์žฅํ•ฉ๋‹ˆ๋‹ค.

  • Information Gap Filling Based : ITRG [97]์€ ๋ฐ˜๋ณต์ ์ธ ๊ฒ€์ƒ‰-์ƒ์„ฑ ํ˜‘๋ ฅ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๋„์ž…ํ•˜์—ฌ, ๊ธฐ์กด ์ง€์‹์„ ๋ฐ”ํƒ•์œผ๋กœ ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•œ ๋’ค, ์ดํ›„ ๋ผ์šด๋“œ์—์„œ ์‘๋‹ต์˜ ์•Œ๋ ค์ง€์ง€ ์•Š์€ ๋ถ€๋ถ„์„ ๊ฒ€์ƒ‰ ๋ฐ ์ƒ์„ฑํ•˜์—ฌ ๋ณด์™„ํ•ฉ๋‹ˆ๋‹ค. ๋น„์Šทํ•˜๊ฒŒ, FLARE [50]๋Š” ๊ฐ ๋ฐ˜๋ณต ๋‹จ๊ณ„์—์„œ ์ƒ์„ฑ๋œ ๋‹ต๋ณ€์˜ ๋‚ฎ์€ ํ™•๋ฅ ์˜ ํ† ํฐ์„ ์ˆ˜์ •ํ•˜๋ฉฐ ๊ฐœ์„ ํ•ฉ๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด, Self-RAG [92]๋Š” ๋Œ€ํ˜• ๋ชจ๋ธ์„ ๋ฏธ์„ธ ์กฐ์ •ํ•˜์—ฌ ์–ธ์ œ ๊ฒ€์ƒ‰์„ ์ค‘๋‹จํ•˜๊ณ  ์งˆ๋ฌธ์— ๋‹ต๋ณ€์„ ์‹œ์ž‘ํ• ์ง€ ์ž์œจ์ ์œผ๋กœ ๊ฒฐ์ •ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•ฉ๋‹ˆ๋‹ค.

4.4 Graph / Tree Question Answering

์•”์‹œ์  ์‚ฌ์‹ค ์งˆ์˜๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์—ฌ๋Ÿฌ ์ฐธ์กฐ ์ž๋ฃŒ์—์„œ ์ •๋ณด๋ฅผ ์ข…ํ•ฉํ•˜๋Š” ์ž‘์—…์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋ž˜ํ”„๋‚˜ ํŠธ๋ฆฌ ๊ตฌ์กฐ๋Š” ์ง€์‹ ๊ธฐ๋ฐ˜์ด๋“  ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜์ด๋“  ๊ฐ„์— ํ…์ŠคํŠธ ๊ฐ„์˜ ๊ด€๊ณ„ ๊ตฌ์กฐ๋ฅผ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ์–ด, ์ด๋Ÿฌํ•œ ์œ ํ˜•์˜ ๋ฐ์ดํ„ฐ ๊ฒ€์ƒ‰ ๋ฌธ์ œ์— ๋งค์šฐ ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค.

  • Traditional Knowledge Graph : ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ(LLM)์˜ ํšจ์œจ์„ฑ์„ ํ–ฅ์ƒ์‹œํ‚ค๊ธฐ ์œ„ํ•ด ๊ณ ๋ ค๋œ ์ดˆ๊ธฐ ๊ตฌ์กฐ ์ค‘ ํ•˜๋‚˜๋Š” ์ „ํ†ต์ ์ธ ์ง€์‹ ๊ทธ๋ž˜ํ”„์ž…๋‹ˆ๋‹ค. ์ด ๊ทธ๋ž˜ํ”„์—์„œ ๊ฐ ๋…ธ๋“œ๋Š” ๊ฐœ์ฒด(entity)๋ฅผ ๋‚˜ํƒ€๋‚ด๊ณ , ๋…ธ๋“œ ๊ฐ„์˜ ์—ฐ๊ฒฐ(์—ฃ์ง€)์€ ๊ฐœ์ฒด๋“ค ๊ฐ„์˜ ๊ด€๊ณ„๋ฅผ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค. [98]์€ LLM๊ณผ ์ง€์‹ ๊ทธ๋ž˜ํ”„(KG)์˜ ๋ฐœ์ „์„ ์œ„ํ•œ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๋ฏธ๋ž˜์ง€ํ–ฅ์ ์ธ ๋กœ๋“œ๋งต์„ ์ œ์•ˆํ–ˆ์Šต๋‹ˆ๋‹ค : KG-enhanced LLMs: LLM์˜ ์‚ฌ์ „ ํ•™์Šต(pre-training) ๋ฐ ์ถ”๋ก (inference) ๋‹จ๊ณ„์—์„œ KG๋ฅผ ํ†ตํ•ฉํ•˜์—ฌ ๋ชจ๋ธ์˜ ์ง€์‹ ์ดํ•ด๋ฅผ ์‹ฌํ™”, LLM-enhanced KGs: KG ์ž„๋ฒ ๋”ฉ, ์™„์„ฑ(completion), ๊ตฌ์ถ•(construction), ๊ทธ๋ž˜ํ”„-ํ…์ŠคํŠธ ์ƒ์„ฑ, ์งˆ๋ฌธ ์‘๋‹ต ๋“ฑ ๋‹ค์–‘ํ•œ KG ์ž‘์—…์— LLM์„ ํ™œ์šฉ, Collaborative LLM+KG ์ ‘๊ทผ๋ฒ•: LLM๊ณผ KG๊ฐ€ ์ƒํ˜ธ ๋ณด์™„์ ์ธ ์—ญํ• ์„ ํ•˜์—ฌ ๋ฐ์ดํ„ฐ์™€ ์ง€์‹์— ๊ธฐ๋ฐ˜ํ•œ ์–‘๋ฐฉํ–ฅ ์ถ”๋ก ์œผ๋กœ ์„œ๋กœ๋ฅผ ๊ฐ•ํ™”.

    Rigel-KQGA ๋ชจ๋ธ [99]์€ ์งˆ์˜์— ๊ธฐ๋ฐ˜ํ•˜์—ฌ ํ•„์š”ํ•œ ์ง€์‹ ๊ทธ๋ž˜ํ”„ ๋…ธ๋“œ๋ฅผ ์˜ˆ์ธกํ•˜๊ณ  ์ด๋ฅผ LLM๊ณผ ๊ฒฐํ•ฉํ•ด ๋‹ต๋ณ€์„ ๋„์ถœํ•˜๋Š” ์—”๋“œ ํˆฌ ์—”๋“œ KGQA ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. Think-on-Graph [100] ๋ฐ KnowledgeNavigator [101]์™€ ๊ฐ™์€ ์—ฐ๊ตฌ๋Š” ์งˆ์˜์™€ ๊ด€๋ จ๋œ ๊ฐœ์ฒด๋ฅผ ์ถ”์ถœํ•œ ํ›„, ๊ทธ๋ž˜ํ”„์—์„œ ๋ฐ˜๋ณต์ ์ธ BFS ๊ฒ€์ƒ‰์„ ์ˆ˜ํ–‰ํ•˜๋ฉฐ LLM์„ ์‚ฌ๊ณ  ๊ธฐ๊ณ„๋กœ ํ™œ์šฉํ•˜์—ฌ ์ตœ์ ์˜ ํƒ์ƒ‰ ๊ฒฝ๋กœ๋ฅผ ๊ฒฐ์ •ํ•˜๊ณ  ๊ฐ€์ง€์น˜๊ธฐ๋ฅผ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค. R3 [102]๋Š” LLM์„ ํ†ตํ•ด ์งˆ์˜์— ๋Œ€์‘ํ•  ์ˆ˜ ์žˆ๋Š” ์—ฌ๋Ÿฌ ์ƒ์‹์  ๊ณต๋ฆฌ๋ฅผ ๋„์ž…ํ•˜๊ณ , ์—ฐ๊ด€๋œ ์ง€์‹ ํ•˜์œ„ ๊ทธ๋ž˜ํ”„๋ฅผ ์ˆœ์ฐจ์ ์œผ๋กœ ๊ฒ€์ƒ‰ํ•˜์—ฌ ํ˜„์žฌ ์ •๋ณด๋กœ ์งˆ์˜๋ฅผ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ๋Š”์ง€ ํ‰๊ฐ€ํ•˜๋ฉฐ, ํ•ด๊ฒฐ๋  ๋•Œ๊นŒ์ง€ ๊ณ„์†ํ•ฉ๋‹ˆ๋‹ค.

  • Data Chunk Graph / Tree : LLM์˜ ๋›ฐ์–ด๋‚œ ๋…ํ•ด ๋Šฅ๋ ฅ์€ ํ…์ŠคํŠธ๋ฅผ ๊ฐ€์žฅ ์„ธ๋ถ€์ ์ธ ์ˆ˜์ค€์œผ๋กœ ๋‚˜๋ˆ„์ง€ ์•Š๊ณ ๋„ ํšจ๊ณผ์ ์œผ๋กœ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. ์ด์™€ ๊ด€๋ จํ•˜์—ฌ ์—ฐ๊ตฌ์ž๋“ค์€ ํ…์ŠคํŠธ ์ฒญํฌ๋‚˜ ๋ฐ์ดํ„ฐ ์ฒญํฌ๋ฅผ ๊ทธ๋ž˜ํ”„๋‚˜ ํŠธ๋ฆฌ์˜ ๋…ธ๋“œ๋กœ ์‚ฌ์šฉํ•˜๊ณ , ์—ฃ์ง€๋ฅผ ํ†ตํ•ด ๊ณ ์ˆ˜์ค€ ๋˜๋Š” ์ •๊ตํ•˜๊ฒŒ ์„ค๊ณ„๋œ ๊ด€๊ณ„๋ฅผ ํ‘œํ˜„ํ•˜๋Š” ์‹คํ—˜์„ ์‹œ์ž‘ํ–ˆ์Šต๋‹ˆ๋‹ค. Knowledge-Graph-Prompting [103]์€ ์•”์‹œ์  ์‚ฌ์‹ค์„ ํƒ๊ตฌํ•ด์•ผ ํ•˜๋Š” ์„ธ ๊ฐ€์ง€ ์œ ํ˜•์˜ ์งˆ๋ฌธ์„ ๋…ผ์˜ํ•ฉ๋‹ˆ๋‹ค:

    • Bridging Questions : ์ˆœ์ฐจ์  ์ถ”๋ก ์— ์˜์กด.

    • Comparing Questions : ๋‹ค๋ฅธ ๊ตฌ์ ˆ ๊ฐ„์˜ ๋ณ‘๋ ฌ์  ์ถ”๋ก ์— ์˜์กด.

    • Structural Questions : ๋ฌธ์„œ ๊ตฌ์กฐ์— ๋Œ€์‘ํ•˜๋Š” ๋‚ด์šฉ์„ ๊ฐ€์ ธ์˜ค๋Š” ๋ฐ ์˜์กด.

    ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด Knowledge-Graph-Prompting์€ ๊ฐœ์ฒด ์ธ์‹, TF-IDF, KNN, ๋ฌธ์„œ ๊ตฌ์กฐ ๊ณ„์ธต์„ ํ™œ์šฉํ•˜์—ฌ ๋ฌธ์„œ ๊ทธ๋ž˜ํ”„๋ฅผ ๊ตฌ์„ฑํ•˜๊ณ , ์งˆ๋ฌธ์— ๋‹ตํ•˜๊ธฐ ์œ„ํ•œ ํ•˜์œ„ ๊ทธ๋ž˜ํ”„๋ฅผ ์ถ”์ถœํ•ฉ๋‹ˆ๋‹ค. MoGG [44]๋Š” ํ•˜๋‚˜ ๋˜๋Š” ๋‘ ๋ฌธ์žฅ์„ ๊ฐ€์žฅ ์ž‘์€ ์˜๋ฏธ ๋‹จ์œ„๋กœ ๊ฐ„์ฃผํ•˜๋ฉฐ ์ด๋ฅผ ๋…ธ๋“œ๋กœ ์‚ฌ์šฉํ•˜๊ณ , ๋…ธ๋“œ ๊ฐ„์˜ ์˜๋ฏธ์  ์œ ์‚ฌ์„ฑ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์—ฃ์ง€๋ฅผ ๊ตฌ์ถ•ํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ, ์˜ˆ์ธก๊ธฐ๋ฅผ ํ›ˆ๋ จ์‹œ์ผœ ์งˆ๋ฌธ์— ๋‹ตํ•˜๊ธฐ ์œ„ํ•ด ํ•„์š”ํ•œ ํ…์ŠคํŠธ์˜ ์„ธ๋ถ„ํ™” ์ •๋„์™€ ํ•„์š”ํ•œ ํ•˜์œ„ ๊ทธ๋ž˜ํ”„์˜ ํฌ๊ธฐ๋ฅผ ๊ฒฐ์ •ํ•ฉ๋‹ˆ๋‹ค. RAPTOR [43]๋Š” ํ…์ŠคํŠธ ๋ธ”๋ก ๊ฐ„์˜ ์ƒ์œ„ ์˜๋ฏธ ๊ด€๊ณ„๋ฅผ ํฌ์ฐฉํ•˜๊ธฐ ์œ„ํ•ด ํด๋Ÿฌ์Šคํ„ฐ๋ง ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‚ฌ์šฉํ•˜์—ฌ ๊ฐ€์žฅ ์„ธ๋ถ„ํ™”๋œ ํ…์ŠคํŠธ ๋ธ”๋ก์„ ๊ณ„์ธต์ ์œผ๋กœ ํด๋Ÿฌ์Šคํ„ฐ๋งํ•ฉ๋‹ˆ๋‹ค. ๊ฐ ๊ณ„์ธต ์ˆ˜์ค€์—์„œ ์ƒˆ๋กœ์šด ์˜๋ฏธ ์ •๋ณด๋ฅผ ์š”์•ฝํ•˜๊ณ , ๋…ธ๋“œ๊ฐ€ ์ถ•์†Œ๋œ ํŠธ๋ฆฌ ๋‚ด์—์„œ ๊ฐ€์žฅ ํ•„์š”ํ•œ ์ •๋ณด๋ฅผ ํ˜ธ์ถœํ•ฉ๋‹ˆ๋‹ค. ์ด์™€ ์œ ์‚ฌํ•˜๊ฒŒ, GraphRAG [104]๋„ ํด๋Ÿฌ์Šคํ„ฐ๋ง ์ ‘๊ทผ ๋ฐฉ์‹์„ ์ฑ„ํƒํ•ฉ๋‹ˆ๋‹ค. ์ดˆ๊ธฐ์—๋Š” ๊ฐ€์žฅ ์ž‘์€ ํ…์ŠคํŠธ ๋ธ”๋ก์„ ์˜๋ฏธ์  ์œ ์‚ฌ์„ฑ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์—ฐ๊ฒฐํ•˜๊ณ , ์ดํ›„ ์ปค๋ฎค๋‹ˆํ‹ฐ ํƒ์ง€ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‚ฌ์šฉํ•˜์—ฌ ๋…ธ๋“œ๋ฅผ ๊ทธ๋ฃนํ™” ํ•ฉ๋‹ˆ๋‹ค. ๋งˆ์ง€๋ง‰์œผ๋กœ, ๊ฐ ๋…ธ๋“œ ์ปค๋ฎค๋‹ˆํ‹ฐ ๋‚ด์˜ ์‘๋‹ต์„ ๋ถ„์„ํ•˜์—ฌ ์งˆ๋ฌธ์— ๋Œ€ํ•œ ๊ธ€๋กœ๋ฒŒ ๋‹ต๋ณ€์„ ์š”์•ฝํ•ฉ๋‹ˆ๋‹ค.

4.5 Natural Language to SQL Queries

๊ตฌ์กฐํ™”๋œ ๋ฐ์ดํ„ฐ๋ฅผ ์ฒ˜๋ฆฌํ•  ๋•Œ, ์ž์—ฐ์–ด ์งˆ์˜๋ฅผ SQL๋กœ ๋ณ€ํ™˜(NL2SQL)ํ•˜๋Š” ๊ฒƒ์€ ํšจ๊ณผ์ ์ธ ์ ‘๊ทผ ๋ฐฉ์‹์ด ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. Chat2DB์™€ ๊ฐ™์€ ๋„๊ตฌ๋Š” ์‚ฌ์šฉ์ž ์งˆ์˜๋ฅผ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ์งˆ์˜๋กœ ๋ณ€ํ™˜ํ•˜์—ฌ ์ด ๊ณผ์ •์„ ์šฉ์ดํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ(LLM)์˜ ์‹œ๋Œ€์— ๋“ค์–ด์™€, ํ…์ŠคํŠธ๋ฅผ SQL๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๊ธฐ์ˆ (text-to-SQL)[105, 106, 107, 108]์ด ํฌ๊ฒŒ ๋ฐœ์ „ํ•˜๋ฉด์„œ, ์ด๋Ÿฌํ•œ ๋„๊ตฌ๋ฅผ ํ™œ์šฉํ•ด ๊ตฌ์กฐํ™”๋œ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์—์„œ ์ •๋ณด๋ฅผ ๊ฒ€์ƒ‰ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

์ด ๊ธฐ๋Šฅ์€ LLM์˜ ์ƒ์„ฑ ๋Šฅ๋ ฅ์„ ๊ฐ•ํ™”ํ•˜๊ธฐ ์œ„ํ•œ ๊ฐ€์น˜ ์žˆ๋Š” ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ ์†Œ์Šค๋กœ ์ž‘์šฉํ•ฉ๋‹ˆ๋‹ค. Text-to-SQL ๋„๊ตฌ๋ฅผ [109] ํ†ตํ•ฉํ•จ์œผ๋กœ์จ, LLM์€ ๊ตฌ์กฐํ™”๋œ ๋ฐ์ดํ„ฐ์— ์ ‘๊ทผํ•˜๊ณ  ์ด๋ฅผ ํ†ตํ•ฉํ•˜์—ฌ ๋ณด๋‹ค ์ •ํ™•ํ•˜๊ณ  ๋งฅ๋ฝ์ ์œผ๋กœ ์ ํ•ฉํ•œ ์‘๋‹ต์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ํ†ตํ•ฉ์€ ์ƒ์„ฑ ์ฝ˜ํ…์ธ ์˜ ๊นŠ์ด์™€ ํ’ˆ์งˆ์„ ํ–ฅ์ƒ์‹œํ‚ฌ ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ LLM์˜ ํ™œ์šฉ ๋ฒ”์œ„๋ฅผ ํ™•์žฅํ•˜์—ฌ, ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ์ฝ˜ํ…์ธ ์™€์˜ ์ƒํ˜ธ์ž‘์šฉ ๋ฐ ํ•ด์„์ด ํ•„์š”ํ•œ ๋ณด๋‹ค ๋ณต์žกํ•œ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•ฉ๋‹ˆ๋‹ค.

4.6 Discussion on Fact Queries

Whether to Use-Finetuing (ํŒŒ์ธํŠœ๋‹์„ ์‚ฌ์šฉํ• ์ง€์— ๋Œ€ํ•œ ์—ฌ๋ถ€)

์ผ๋ถ€ ์—ฐ๊ตฌ [110]๋Š” LLM(๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ)์ด ํŒŒ์ธํŠœ๋‹์„ ํ†ตํ•ด ์ƒˆ๋กœ์šด ์‚ฌ์‹ค์  ์ง€์‹์„ ์Šต๋“ํ•˜๋Š” ๋ฐ ์–ด๋ ค์›€์„ ๊ฒช๋Š”๋‹ค๋Š” ์ ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ์ด ๊ณผ์ •์€ LLM์˜ ์ „๋ฐ˜์ ์ธ ์„ฑ๋Šฅ ์ €ํ•˜๋ฅผ ์ดˆ๋ž˜ํ•˜์—ฌ ์ •ํ™•ํ•œ ์‘๋‹ต ์ƒ์„ฑ ๋Šฅ๋ ฅ์„ ์•ฝํ™”์‹œํ‚ค๊ณ , ํ™˜๊ฐ(hallucination)์ด ๋” ๋งŽ์ด ๋ฐœ์ƒํ•˜๋Š” ๊ฒฐ๊ณผ๋ฅผ ๋‚ณ์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ์—ฐ๊ตฌ [111]์— ๋”ฐ๋ฅด๋ฉด, ์ƒˆ๋กœ์šด ์‚ฌ์‹ค์  ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ LLM์„ ํŒŒ์ธํŠœ๋‹ํ•˜๋ฉด ๋ชจ๋ธ์ด ์‚ฌ์‹ค ์ง„์ˆ ์„ ๊ธฐ๊ณ„์ ์œผ๋กœ ์•”๊ธฐํ•  ๊ฐ€๋Šฅ์„ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ํฅ๋ฏธ๋กญ๊ฒŒ๋„, ์ด๋Ÿฌํ•œ ์•”๊ธฐ๋œ ์‚ฌ์‹ค์˜ ํ‘œํ˜„ ๋ฐฉ์‹์„ ๋ณ€๊ฒฝํ•˜๋ฉด ์ตœ๊ทผ ํ•™์Šต๋œ ์ง€์‹์ด ํšจ๊ณผ๋ฅผ ์žƒ์„ ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ด๋Š” LLM์ด ํ‘œ๋ฉด์ ์ธ ์ˆ˜์ค€์˜ ์ดํ•ด์™€ ๊ธฐ์–ต๋งŒ์„ ์œ ์ง€ํ•˜๊ณ  ์žˆ์Œ์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๊ฒฐ๊ณผ๋Š” ํ˜„์žฌ์˜ ํŒŒ์ธํŠœ๋‹ ํ”„๋กœ์„ธ์Šค๊ฐ€ ๊ฐ€์ง„ ํ•œ๊ณ„๋ฅผ ๋ณด์—ฌ์ฃผ๋ฉฐ, ์ƒˆ๋กœ์šด ์ •๋ณด๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ํ†ตํ•ฉํ•˜๊ณ  ์ ์‘์‹œํ‚ค๊ธฐ ์œ„ํ•œ ๋ณด๋‹ค ์ •๊ตํ•œ ๋ฐฉ๋ฒ•์ด ํ•„์š”ํ•˜๋‹ค๋Š” ๊ฒƒ์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค.

Wheter to Seperate Different Levels of Fact Queries (์‚ฌ์‹ค ์งˆ์˜์˜ ์ˆ˜์ค€์„ ๊ตฌ๋ถ„ํ•  ํ•„์š”์„ฑ)

๋ช…์‹œ์  ์‚ฌ์‹ค ์งˆ์˜ (Explicit Fact Query)์™€ ์•”์‹œ์  ์‚ฌ์‹ค ์งˆ์˜ (Implicit Fact Query)๋Š” ๋ชจ๋‘ ์‚ฌ์‹ค ๊ธฐ๋ฐ˜ ์งˆ์˜์— ์†ํ•˜์ง€๋งŒ, ๋ฐ์ดํ„ฐ ์ฆ๊ฐ• ๊ธฐ๋ฐ˜ LLM ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ๊ตฌ์ถ•ํ•˜๊ธฐ ์ „์— ์ด ์งˆ์˜๋“ค์ด ์–ด๋–ค ์ˆ˜์ค€์— ์†ํ•˜๋Š”์ง€ ํŒ๋‹จํ•˜๋Š” ๊ฒƒ์ด ๋งค์šฐ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ๋ช…์‹œ์  ์‚ฌ์‹ค ์งˆ์˜๋ฅผ ์•”์‹œ์  ์‚ฌ์‹ค ์งˆ์˜๋กœ ์ž˜๋ชป ๋ถ„๋ฅ˜ํ•˜๋ฉด, ๊ด€๋ จ ์žˆ์–ด ๋ณด์ด์ง€๋งŒ ๊ถ๊ทน์ ์œผ๋กœ๋Š” ์งˆ๋ฌธ์— ๋„์›€์ด ๋˜์ง€ ์•Š๋Š” ํ”ผ์ƒ์ ์ธ ์ •๋ณด๊ฐ€ ๊ณผ๋„ํ•˜๊ฒŒ ๊ฒ€์ƒ‰๋˜์–ด LLM์„ ์˜ค๋„ํ•˜๊ฑฐ๋‚˜ ๋ถˆํ•„์š”ํ•œ ๊ณ„์‚ฐ ์ž์›์„ ๋‚ญ๋น„ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋Œ€๋กœ, ์•”์‹œ์  ์‚ฌ์‹ค ์งˆ์˜๋ฅผ ๋ช…์‹œ์  ์‚ฌ์‹ค ์งˆ์˜๋กœ ์ž˜๋ชป ๋ถ„๋ฅ˜ํ•˜๋ฉด, ์ถฉ๋ถ„ํ•˜๊ณ  ํฌ๊ด„์ ์ธ ์™ธ๋ถ€ ๋ณด์กฐ ๋ฐ์ดํ„ฐ๋ฅผ ๊ฒ€์ƒ‰ํ•˜๊ธฐ ์œ„ํ•œ ์ ์ ˆํ•œ ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ•˜์ง€ ๋ชปํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์•”์‹œ์  ์‚ฌ์‹ค ์งˆ์˜๋Š” ๋Œ€๊ฐœ ์งˆ์˜์˜ ๋งฅ๋ฝ์— ๋”ฐ๋ผ ๋™์ ์œผ๋กœ ์ •๋ณด๋ฅผ ํ†ตํ•ฉํ•ด์•ผ ํ•˜๋Š” ๋ฐ˜๋ฉด, ๋ช…์‹œ์  ์‚ฌ์‹ค ์งˆ์˜๋Š” ์ผ๋ฐ˜์ ์œผ๋กœ ๋‹จ์ผ ๋ฐ์ดํ„ฐ ์กฐ๊ฐ๋งŒ ํ•„์š”ํ•˜๋ฉฐ ๊ณ ์ •๋œ ์–‘์˜ ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๋ฅผ ๊ฒ€์ƒ‰ํ•˜๋Š” ๊ฒƒ์œผ๋กœ ์ถฉ๋ถ„ํ•ฉ๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ์ž˜๋ชป๋œ ๋ถ„๋ฅ˜๋Š” LLM์˜ ์„ฑ๋Šฅ ์ €ํ•˜๋กœ ์ด์–ด์งˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ, ๋ชฉํ‘œ ์ž‘์—…์— ๋Œ€ํ•œ ์ฒ ์ €ํ•œ ์ดํ•ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์งˆ์˜์˜ ์ˆ˜์ค€์„ ์‚ฌ์ „์— ๊ตฌ๋ณ„ํ•˜๋Š” ๊ฒƒ์ด ์œ ๋ฆฌํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ, ๊ฒ€์ƒ‰๋œ ์ •๋ณด๊ฐ€ ์ถฉ๋ถ„ํ•œ์ง€ ์—ฌ๋ถ€๋ฅผ ์ž์œจ์ ์œผ๋กœ ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ๋„๋ก ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•˜๋Š” ๋ฐ ์ƒ๋‹นํ•œ ๋…ธ๋ ฅ์ด ๊ธฐ์šธ์—ฌ์ง€๊ณ  ์žˆ์œผ๋ฉฐ, Self-RAG [92]์™€ ๊ฐ™์€ ์ ‘๊ทผ๋ฒ•์ด ๊ทธ ์˜ˆ์‹œ์ž…๋‹ˆ๋‹ค.

5. Interpretable Rationale Queries (L3)

5.1 Overview

์ด ์„น์…˜๊ณผ ๋‹ค์Œ ์„น์…˜์—์„œ๋Š” ๋ฌธ์ œ ํ•ด๊ฒฐ์„ ์œ„ํ•ด ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ๊ทผ๊ฑฐ(rationale)๋ฅผ ์ œ๊ณตํ•ด์•ผ ํ•˜๋Š” ์งˆ์˜๋ฅผ ํƒ๊ตฌํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์งˆ์˜๋Š” ์‚ฌ์‹ค์  ๋‚ด์šฉ์„ ์ดํ•ดํ•˜๋Š” ๊ฒƒ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ, ๋ฐ์ดํ„ฐ์˜ ๋งฅ๋ฝ์— ๋‚ด์žฌ๋œ ๋„๋ฉ”์ธ์— ํŠนํ™”๋œ ๊ทผ๊ฑฐ๋ฅผ ์ดํ•ดํ•˜๊ณ  ์ ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๋Šฅ๋ ฅ์„ ์š”๊ตฌํ•ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ์ด๋Ÿฌํ•œ ์งˆ์˜๋ฅผ ๋…ผ๊ฑฐ์˜ ํŠน์„ฑ์— ๋”ฐ๋ผ ํ•ด์„ ๊ฐ€๋Šฅํ•œ ๊ทผ๊ฑฐ์— ๊ธฐ๋ฐ˜ํ•œ ์งˆ์˜์™€ ์ˆจ๊ฒจ์ง„ ๊ทผ๊ฑฐ์— ๊ธฐ๋ฐ˜ํ•œ ์งˆ์˜์˜ ๋‘ ๊ฐ€์ง€ ๋ฒ”์ฃผ๋กœ ๋ถ„๋ฅ˜ํ•ฉ๋‹ˆ๋‹ค. ์ด ๋‚ด์šฉ์€ Figure 04์— ๋‚˜ํƒ€๋‚˜ ์žˆ์Šต๋‹ˆ๋‹ค.

ํ•ด์„ ๊ฐ€๋Šฅํ•œ ๊ทผ๊ฑฐ์— ๊ธฐ๋ฐ˜ํ•œ ์งˆ์˜๋Š” ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ๊ทผ๊ฑฐ๋ฅผ ์ œ๊ณตํ•ด์•ผ ํ•˜๋Š” ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ ์ค‘ ๋น„๊ต์  ๋‹จ์ˆœํ•œ ๋ฒ”์ฃผ์— ์†ํ•ฉ๋‹ˆ๋‹ค. ์ด ์œ ํ˜•์˜ ์งˆ์˜๋ฅผ ์œ„ํ•œ ๋ณด์กฐ ๋ฐ์ดํ„ฐ๋Š” ๋ฌธ์ œ ํ•ด๊ฒฐ์— ์‚ฌ์šฉ๋˜๋Š” ์‚ฌ๊ณ  ๊ณผ์ •์„ ๋ช…ํ™•ํ•˜๊ฒŒ ์„ค๋ช…ํ•˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฐ์ดํ„ฐ๋Š” ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ํ˜•์‹์œผ๋กœ ๊ตฌ์„ฑ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค:

  • Plain Text : ํ…์ŠคํŠธ๋กœ ํ‘œํ˜„๋œ ์„ค๋ช…์€ ํ•ด์„ ๊ฐ€๋Šฅํ•œ ๋…ผ๊ฑฐ๋ฅผ ์ œ๊ณตํ•˜๋Š” ๊ฐ€์žฅ ์ผ๋ฐ˜์ ์ธ ํ˜•์‹์ž…๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์—๋Š” ํ•ธ๋“œ๋ถ, ๊ฐ€์ด๋“œ๋ผ์ธ๊ณผ ๊ฐ™์€ ์ „๋ฌธ ๋ฌธ์„œ๋‚˜ ๋„๋ฉ”์ธ ํŠนํ™” ๋งค๋‰ด์–ผ, ์šด์˜ ๊ฐ€์ด๋“œ๊ฐ€ ํฌํ•จ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ํ…์ŠคํŠธ๋Š” ๋ณต์žกํ•œ ์ƒํ™ฉ์—์„œ ์˜์‚ฌ๊ฒฐ์ •์„ ์šฉ์ดํ•˜๊ฒŒ ํ•˜๋Š” ์ถ”๋ก  ๊ณผ์ •์„ ๋ช…ํ™•ํžˆ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์ œ์•ฝ ๊ณต์žฅ์„ ์œ„ํ•œ FDA ์ง€์นจ์ด๋‚˜ ์˜์‚ฌ๋ฅผ ์œ„ํ•œ ์•ฝ๋ฌผ ์‚ฌ์šฉ ๊ฐ€์ด๋“œ๋Š” FDA ๊ฒ€์‚ฌ๊ด€์ด๋‚˜ ์˜์‚ฌ์™€ ๊ฐ™์€ ์ „๋ฌธ๊ฐ€๋“ค์ด ํŠน์ • ์‚ฌ๋ก€์— ์ ‘๊ทผํ•˜๋Š” ๋ฐฉ์‹์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

  • Structured Instruction : ๋” ๋ช…ํ™•ํ•œ ์ถ”๋ก  ๊ด€๊ณ„๋‚˜ ์˜์‚ฌ๊ฒฐ์ • ๊ฒฝ๋กœ๋Š” ๊ตฌ์กฐํ™”๋œ ํ˜•์‹์œผ๋กœ ์ œ์‹œ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋…ผ๊ฑฐ๋Š” ํ…์ŠคํŠธ ์กฐ๊ฑด ๊ธฐ๋ฐ˜ ๋ฌด์–ด ๋จธ์‹ (Text-Conditioned Moore Machine) ๋˜๋Š” **ํ…์ŠคํŠธ ์กฐ๊ฑด ๊ธฐ๋ฐ˜ ๋ฐ€๋ฆฌ ๋จธ์‹ (Text-Conditioned Mealy Machine)**์œผ๋กœ ์ดํ•ด๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

    • ๋ฌด์–ด ๋จธ์‹ ์€ ์ถœ๋ ฅ ๊ฐ’์ด ํ˜„์žฌ ์ƒํƒœ์— ์˜ํ•ด์„œ๋งŒ ๊ฒฐ์ •๋˜๋Š” ์œ ํ•œ ์ƒํƒœ ๋จธ์‹ ์ž…๋‹ˆ๋‹ค. ์ƒํƒœ ์ „ํ™˜์„ ์ œ์–ดํ•˜๋Š” ์กฐ๊ฑด์€ ํ…์ŠคํŠธ๋กœ ํ‘œํ˜„๋˜๋ฉฐ, ์ด๋Š” LLM์ด ํ•ด์„ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๊ณ ๊ฐ ์ง€์› ์—์ด์ „ํŠธ๊ฐ€ ์ œํ’ˆ ๊ตํ™˜์ด๋‚˜ ํ™˜๋ถˆ ์š”์ฒญ์„ ์ฒ˜๋ฆฌํ•˜๊ธฐ ์œ„ํ•ด ํ•ธ๋“œ๋ถ์„ ๋”ฐ๋ฅด๋Š” ๊ฒฝ์šฐ๊ฐ€ ์ด์— ํ•ด๋‹นํ•ฉ๋‹ˆ๋‹ค.

    • ๋ฐ€๋ฆฌ ๋จธ์‹ ์€ ์ถœ๋ ฅ ๊ฐ’์ด ํ˜„์žฌ ์ƒํƒœ์™€ ์ž…๋ ฅ ๋ชจ๋‘์— ์˜ํ•ด ๊ฒฐ์ •๋˜๋Š” ์œ ํ•œ ์ƒํƒœ ๋จธ์‹ ์ž…๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ ์•ก์…˜(API ํ˜ธ์ถœ ๋“ฑ)์€ ํ˜„์žฌ ์ƒํƒœ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ์ด์ „ ์ƒํƒœ์˜ ์ „ํ™˜๊ณผ ๊ด€๋ จ๋œ ํ…์ŠคํŠธ ๋ฉ”์‹œ์ง€์— ์˜ํ•ด ๊ฒฐ์ •๋ฉ๋‹ˆ๋‹ค.

๋„๋ฉ”์ธ ํŠนํ™” ๋…ผ๊ฑฐ๋Š” ์›Œํฌํ”Œ๋กœ์šฐ, ์˜์‚ฌ๊ฒฐ์ • ํŠธ๋ฆฌ, ์˜์‚ฌ์ฝ”๋“œ(pseudocode)์™€ ๊ฐ™์€ ํ˜•์‹์œผ๋กœ ํ‘œํ˜„๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

ํ•ด๋‹น ๋ ˆ๋ฒจ์—์„œ์˜ ์งˆ์˜ ์˜ˆ์‹œ

  • ๊ฐ€์Šด ํ†ต์ฆ๊ณผ ํŠน์ • ์ฆ์ƒ ์„ค๋ช…์ด ์žˆ๋Š” ํ™˜์ž๋Š” ์–ด๋–ป๊ฒŒ ์ง„๋‹จํ•˜๊ณ  ์น˜๋ฃŒํ•ด์•ผ ํ•˜๋Š”๊ฐ€? (๊ฐ€์Šด ํ†ต์ฆ ๊ด€๋ฆฌ ์ง€์นจ์ด ์ฃผ์–ด์ง„ ๊ฒฝ์šฐ)

  • ์‹ค์ œ ์ƒํ™ฉ์—์„œ ์‚ฌ์šฉ์ž์˜ ์งˆ๋ฌธ์— ์–ด๋–ป๊ฒŒ ์‘๋‹ตํ•ด์•ผ ํ•˜๋Š”๊ฐ€? (๊ณ ๊ฐ ์„œ๋น„์Šค ์›Œํฌํ”Œ๋กœ์šฐ๊ฐ€ ์ฃผ์–ด์ง„ ๊ฒฝ์šฐ)

5.2 Challenges and Solution

ํ•ด์„ ๊ฐ€๋Šฅํ•œ ๋…ผ๊ฑฐ ์งˆ์˜(interpretable rationale queries) ์˜์—ญ์—์„œ๋Š” ๋„๋ฉ”์ธ ํŠนํ™” ๋…ผ๊ฑฐ๋ฅผ LLM์— ์ดํ•ดํ•˜๊ธฐ ์‰ฌ์šด ๋ฐฉ์‹์œผ๋กœ ํ†ตํ•ฉํ•˜๋Š” ๋ฐ ์ถ”๊ฐ€์ ์ธ ๋„์ „ ๊ณผ์ œ๊ฐ€ ์กด์žฌํ•ฉ๋‹ˆ๋‹ค. ์ฃผ์š” ๊ณผ์ œ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:

  • ํ”„๋กฌํ”„ํŠธ ์ตœ์ ํ™” ๋น„์šฉ(Prompt Optimization Costs) : ํ”„๋กฌํ”„ํŠธ๋ฅผ ์ตœ์ ํ™”ํ•˜๋Š” ๊ณผ์ •์€ ๋†’์€ ์‹œ๊ฐ„์ , ๊ณ„์‚ฐ์  ์ž์›์„ ์š”๊ตฌํ•ฉ๋‹ˆ๋‹ค. ๊ฐ๊ธฐ ๋‹ค๋ฅธ ์งˆ์˜๋Š” ๋งž์ถคํ˜• ๋ฐฐ๊ฒฝ ์ง€์‹๊ณผ ์˜์‚ฌ๊ฒฐ์ • ๊ธฐ์ค€์„ ํ•„์š”๋กœ ํ•˜๋ฉฐ, ์ด๋ฅผ ์œ„ํ•ด ๋‹ค์–‘ํ•œ ์˜ˆ์‹œ๊ฐ€ ์š”๊ตฌ๋ฉ๋‹ˆ๋‹ค. ์ˆ˜๋™์œผ๋กœ ์„ค๊ณ„๋œ ํ”„๋กฌํ”„ํŠธ๋Š” ๋งค์šฐ ํšจ๊ณผ์ ์ผ ์ˆ˜ ์žˆ์ง€๋งŒ, ๋งŽ์€ ๋…ธ๋™๋ ฅ๊ณผ ์‹œ๊ฐ„์ด ์†Œ์š”๋ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ, ๋‹ค์–‘ํ•œ ์งˆ์˜์— ๋งž์ถคํ˜• ํ”„๋กฌํ”„ํŠธ๋ฅผ ์ƒ์„ฑํ•˜๋„๋ก ๋ชจ๋ธ์„ ํ›ˆ๋ จ์‹œํ‚ค๋Š” ๊ณผ์ •์€ ์ƒ๋‹นํ•œ ๊ณ„์‚ฐ ๋น„์šฉ์„ ์ดˆ๋ž˜ํ•ฉ๋‹ˆ๋‹ค.

  • ์ œํ•œ๋œ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ(Limited Interpretability) : ํ”„๋กฌํ”„ํŠธ๊ฐ€ LLM์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์€ ๋ถˆํˆฌ๋ช…ํ•ฉ๋‹ˆ๋‹ค. ๋งŽ์€ ๊ฒฝ์šฐ, LLM์˜ ๋‚ด๋ถ€ ๋งค๊ฐœ๋ณ€์ˆ˜์— ์ ‘๊ทผํ•˜๋Š” ๊ฒƒ์ด ์ œํ•œ์ ์ด๊ธฐ ๋•Œ๋ฌธ์— ๋‹ค์–‘ํ•œ ํ”„๋กฌํ”„ํŠธ๊ฐ€ ๋ชจ๋ธ์— ์–ด๋–ค ์˜ํ–ฅ์„ ๋ฏธ์น˜๋Š”์ง€ ํŒŒ์•…ํ•˜๋Š” ์ผ์ด ์–ด๋ ต์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ํˆฌ๋ช…์„ฑ ๋ถ€์กฑ์€ LLM์ด ์„œ๋กœ ๋‹ค๋ฅธ ํ”„๋กฌํ”„ํŠธ์— ๋Œ€ํ•ด ์ƒ์„ฑํ•œ ์‘๋‹ต์˜ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ์„ ์ผ๊ด€๋˜๊ฒŒ ์ดํ•ดํ•˜๊ณ  ๊ฒ€์ฆํ•˜๋Š” ๋ฐ ์žฅ์• ๋ฌผ์ด ๋ฉ๋‹ˆ๋‹ค.

5.3 Prompt Tuning

ํ•ด์„ ๊ฐ€๋Šฅํ•œ ๋…ผ๊ฑฐ ์งˆ์˜์—์„œ๋Š” ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ์—์„œ ์ œ๊ณต๋œ ๋…ผ๊ฑฐ๋ฅผ LLM์— ํšจ๊ณผ์ ์œผ๋กœ ํ†ตํ•ฉํ•˜๊ณ , ๋ชจ๋ธ์ด ์ด๋Ÿฌํ•œ ๋…ผ๊ฑฐ๋ฅผ ์ •ํ™•ํžˆ ๋”ฐ๋ฅด๊ณ  ๋ฐ˜์‘ํ•˜๋„๋ก ๋ณด์žฅํ•˜๋Š” ๊ฒƒ์ด ํ•ต์‹ฌ ๊ณผ์ œ์ž…๋‹ˆ๋‹ค. Text2MDT [112]๋Š” ์ด์™€ ๊ด€๋ จํ•ด ์œ ์šฉํ•œ ์‚ฌ๋ก€๋ฅผ ์ œ์‹œํ•˜๋ฉฐ, ์˜ํ•™ ๊ฐ€์ด๋“œ๋ผ์ธ๊ณผ ๊ต๊ณผ์„œ์—์„œ ์˜ํ•™์  ์˜์‚ฌ๊ฒฐ์ • ํŠธ๋ฆฌ๋ฅผ ์ž๋™์œผ๋กœ ์ถ”์ถœํ•˜๋Š” ๋‘ ๊ฐ€์ง€ ๋ฐฉ๋ฒ•์„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค. ์ด ๊ณผ์ •์„ ํ†ตํ•ด ๊ธด ์˜ํ•™ ํ…์ŠคํŠธ ๋‚ด ๋…ผ๋ฆฌ์  ์ฒด๊ณ„๋ฅผ ๋ช…ํ™•ํžˆ ํ•˜์—ฌ ์ดํ•ด๋ฅผ ๋” ์šฉ์ดํ•˜๊ฒŒ ๋งŒ๋“ญ๋‹ˆ๋‹ค. ์ด์™€ ์œ ์‚ฌํ•˜๊ฒŒ, MedDM [113]์€ LLM์ด ์‹คํ–‰ ๊ฐ€๋Šฅํ•œ ์ž„์ƒ ๊ฐ€์ด๋“œ ํŠธ๋ฆฌ(CGT)๋ฅผ ๊ฐœ๋ฐœํ•˜๊ณ , ์ด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์ถ”๋ก ํ•˜๋Š” ๋ฐฉ๋ฒ•๋ก ๊ณผ ํ™˜์ž์™€ LLM ๊ฐ„ ๋‹ค์ค‘ ๋Œ€ํ™” ํ„ด์„ ์œ„ํ•œ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. InstructRec [114]๋Š” ์ถ”์ฒœ ์‹œ์Šคํ…œ์—์„œ LLM์˜ ์—ญ๋Ÿ‰์„ ํ™œ์šฉํ•˜๊ธฐ ์œ„ํ•ด, ์‚ฌ์šฉ์ž์˜ ์„ ํ˜ธ๋„, ์˜๋„, ์ž‘์—… ํ˜•ํƒœ, ๋งฅ๋ฝ์„ ์ž์—ฐ์–ด๋กœ ์„ค๋ช…ํ•˜๋Š” ๋ฒ”์šฉ ํฌ๋งท์„ ์„ค๊ณ„ํ•˜์—ฌ ๊ณ ์„ฑ๋Šฅ ์–ธ์–ด ๊ธฐ๋ฐ˜ ์ถ”์ฒœ ์‹œ์Šคํ…œ์„ ๊ตฌ์ถ•ํ•ฉ๋‹ˆ๋‹ค.

๋…ผ๊ฑฐ๋ฅผ ์ž์—ฐ์–ด ์ง€์นจ์œผ๋กœ LLM์— ์ง์ ‘ ํ†ตํ•ฉํ•˜๋Š” ๊ฒƒ์ด ํ•ญ์ƒ ์ตœ์ ์˜ ์„ฑ๋Šฅ์„ ๋ณด์žฅํ•˜์ง€๋Š” ์•Š์œผ๋ฉฐ, ์ˆ˜๋™์œผ๋กœ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์„ค๊ณ„ํ•˜๋Š” ๋ฐ๋Š” ๋งŽ์€ ์‹œ๊ฐ„์ด ์†Œ์š”๋ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ํ”„๋กฌํ”„ํŠธ ํŠœ๋‹(prompt tuning) ๊ธฐ์ˆ ์ด ํ•„์ˆ˜์ ์ด๋ฉฐ, ์ด๋ฅผ ํ†ตํ•ด LLM์ด ํŠน์ • ๋…ผ๊ฑฐ๋ฅผ ๋” ์ž˜ ๋”ฐ๋ฅผ ์ˆ˜ ์žˆ๋„๋ก ๊ฐ•ํ™”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. TEMPERA ํ”„๋ ˆ์ž„์›Œํฌ [115]: ์ œํ•œ๋œ ์ง€์นจ, ์˜ˆ์ œ, ๋‹จ์–ดํ™”(verbalizer)๋ฅผ ๊ฐ•ํ™” ํ•™์Šต์˜ ์•ก์…˜ ๊ณต๊ฐ„์— ํฌํ•จํ•˜๋Š” ํ”„๋กฌํ”„ํŠธ๋ฅผ ์„ค๊ณ„ํ•ฉ๋‹ˆ๋‹ค. ์ด ๊ณผ์ •์—์„œ LLM์ด ์ •ํ™•ํ•œ ์‘๋‹ต์„ ์ƒ์„ฑํ•  ํ™•๋ฅ ์„ ๋ณด์ƒ์œผ๋กœ ์‚ผ์•„, ๋ฐ์ดํ„ฐ์…‹ ์ „๋ฐ˜์—์„œ ์ตœ์ ์˜ ํ”„๋กฌํ”„ํŠธ ๊ตฌ์„ฑ์„ ๋ฐœ๊ฒฌํ•˜๋„๋ก ๋ชจ๋ธ์„ ์•ˆ๋‚ดํ•ฉ๋‹ˆ๋‹ค. RLPrompt [116]: ๊ฐ•ํ™” ํ•™์Šต ๊ธฐ๋ฒ•์„ ์‚ฌ์šฉํ•ด ์–ด๋Œ‘ํ„ฐ๋ฅผ ํ›ˆ๋ จ์‹œ์ผœ, LLM์˜ ์‘๋‹ต ์ •ํ™•์„ฑ์— ๋Œ€ํ•œ ํ”ผ๋“œ๋ฐฑ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์ž‘์€ ์–ธ์–ด ๋ชจ๋ธ์ด ์ตœ์ ์˜ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ๋„๋ก ๋•์Šต๋‹ˆ๋‹ค. Directional Stimulus Prompting: LLM์˜ ๋‹ค์šด์ŠคํŠธ๋ฆผ ์ž‘์—… ์„ฑ๋Šฅ์„ ๋ณด์ƒ ๋ฉ”์ปค๋‹ˆ์ฆ˜์œผ๋กœ ํ™œ์šฉํ•˜์—ฌ, ๊ฐœ๋ณ„ ์‚ฌ๋ก€์— ๋งž์ถ˜ ํŠน์ • ๋‹จ์„œ๋‚˜ ํ‚ค์›Œ๋“œ๋ฅผ ํ”„๋กฌํ”„ํŠธ๋กœ ์‚ฌ์šฉํ•˜๋„๋ก ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด LLM์˜ ํ–‰๋™์ด ์˜ˆ์ƒ ๊ฒฐ๊ณผ์— ๋”์šฑ ์ž˜ ๋ถ€ํ•ฉํ•˜๋„๋ก ํ•ฉ๋‹ˆ๋‹ค.

GrIPS [117]: ์†Œ๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹์„ ํ‰๊ฐ€ ๊ธฐ์ค€์œผ๋กœ ์‚ฌ์šฉํ•˜์—ฌ ๋‹ค์–‘ํ•œ ํ”„๋กฌํ”„ํŠธ ์ˆ˜์ •(์‚ญ์ œ, ๊ต์ฒด, ํŒจ๋Ÿฌํ”„๋ ˆ์ด์ง•, ์ถ”๊ฐ€)์„ ์‹คํ—˜ํ•จ์œผ๋กœ์จ ์‹ ์†ํ•˜๊ณ  ํšจ๊ณผ์ ์œผ๋กœ ์ตœ์ ์˜ ํ”„๋กฌํ”„ํŠธ ๊ตฌ์„ฑ์„ ์ฐพ์•„๋ƒ…๋‹ˆ๋‹ค.

OPRO [120]: LLM์ด ๊ณผ๊ฑฐ ๋ฐ์ดํ„ฐ์™€ ํ•ด๋‹น ์„ฑ๋Šฅ ์ง€ํ‘œ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์ƒˆ๋กœ์šด ํ”„๋กฌํ”„ํŠธ ์†”๋ฃจ์…˜์„ ์ƒ์„ฑํ•˜๊ณ , ์ด๋ฅผ ํ‰๊ฐ€ํ•˜์—ฌ ์ตœ์ ํ™” ๊ณผ์ •์„ ๊ฐ„์†Œํ™”ํ•ฉ๋‹ˆ๋‹ค. Reflexion [121]: ์–ธ์–ด์  ํ”ผ๋“œ๋ฐฑ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ”„๋กฌํ”„ํŠธ ์ตœ์ ํ™”๋ฅผ ์ˆ˜ํ–‰ํ•˜๋Š” ์ƒˆ๋กœ์šด ์ ‘๊ทผ๋ฒ•์œผ๋กœ, LLM ์ถœ๋ ฅ์„ ๋ถ„์„ํ•˜๊ณ  ์ด๋ฅผ ์—ํ”ผ์†Œ๋“œ ๋ฉ”๋ชจ๋ฆฌ ๋ฒ„ํผ์— ์ €์žฅํ•ฉ๋‹ˆ๋‹ค. ์ด ๋ฉ”๋ชจ๋ฆฌ๋Š” ๊ณผ๊ฑฐ์˜ ํ†ต์ฐฐ์„ ํ™œ์šฉํ•ด ์˜์‚ฌ๊ฒฐ์ •์„ ์ •๊ตํ™”ํ•˜๊ณ , ํ–ฅํ›„ ์ƒํ˜ธ์ž‘์šฉ์—์„œ ๊ฒฐ๊ณผ๋ฅผ ํ‰๊ฐ€ํ•˜๋Š” ๋ฐ ๋„์›€์„ ์ค๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์ ‘๊ทผ๋ฒ•๋“ค์€ ํ”„๋กฌํ”„ํŠธ ์ตœ์ ํ™”๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ์ˆ˜ํ–‰ํ•˜๋ฉฐ, LLM์˜ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๊ณ  ๋‹ค์–‘ํ•œ ๋„๋ฉ”์ธ ํŠนํ™” ๋…ผ๊ฑฐ๋ฅผ ํ™œ์šฉํ•˜๋Š” ๋ฐ ์ค‘์š”ํ•œ ์—ญํ• ์„ ํ•ฉ๋‹ˆ๋‹ค.

5.4 CoT Prompting

๋ณต์žกํ•œ ๋…ผ๊ฑฐ๋ฅผ ์ฒ˜๋ฆฌํ•˜๋ ค๋ฉด LLM์ด ํ™•์žฅ๋œ ์ถ”๋ก  ์ฒด์ธ์„ ์ˆ˜ํ–‰ํ•ด์•ผ ํ•˜๋ฉฐ, ์ด๋Š” ์ผ๋ฐ˜์ ์ธ ์‚ฌ์‹ค ์งˆ์˜์—์„œ์˜ ์ด์งˆ์ ์ธ ์‚ฌ์‹ค ์ •๋ณด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ ์ถ”๋ก ๊ณผ๋Š” ๊ตฌ๋ณ„๋ฉ๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ Chain-of-Thoughts (CoT) [122], Tree-of-Thoughts [123], ๋˜๋Š” Graph-of-Thoughts [124]์™€ ๊ฐ™์€ ๋ฐฉ๋ฒ•๋ก ์€ ์ด๋Ÿฌํ•œ ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ ํšจ๊ณผ์ ์ž„์ด ์ž…์ฆ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์—ฐ๊ตฌ๋“ค์€ ๋งŽ์ด ์—ฐ๊ตฌ๋˜์—ˆ๊ณ  ์ผ๋ฐ˜์ ์ธ ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ์ด ๋†’์€ ๋ฌธ์ œ์— ๋Œ€ํ•ด์„œ๋Š” ์ˆ˜๋™์œผ๋กœ CoT ํ”„๋กฌํ”„ํŠธ๋ฅผ ์„ค๊ณ„ํ•˜๋Š” ๊ฒƒ์ด ์œ ์šฉํ•œ ํ•ด๊ฒฐ์ฑ…์œผ๋กœ ๋‚˜ํƒ€๋‚ฌ์Šต๋‹ˆ๋‹ค. Ji et al. (2023) [125]๋Š” ์ง€์‹ ์Šต๋“๊ณผ ๋‹ต๋ณ€ ์ƒ์„ฑ์„ ํ†ตํ•ฉํ•œ ์ž๊ธฐ ๋ฐ˜์„ฑ(self-reflection) ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ–ˆ์Šต๋‹ˆ๋‹ค. ์™ธ๋ถ€ ๋„๊ตฌ๋ฅผ ํ™œ์šฉํ•˜๊ณ  ํ”„๋กฌํ”„ํŠธ๋ฅผ ์„ค๊ณ„ํ•˜์—ฌ, ๋‹ค์Œ ์„ธ ๊ฐ€์ง€ ์œ ํ˜•์˜ ์ž๊ธฐ ๋ฐ˜์„ฑ ๋ฃจํ”„๋ฅผ ๊ตฌ์ถ•ํ–ˆ์Šต๋‹ˆ๋‹ค: ์‚ฌ์‹ค์  ์ง€์‹ ์Šต๋“ ๋ฃจํ”„(Factual Knowledge Acquiring Loop), ์ง€์‹ ์ผ๊ด€์„ฑ ๋‹ต๋ณ€ ๋ฃจํ”„(Knowledge-Consistent Answering Loop), ์งˆ๋ฌธ ํ•จ์˜ ๋‹ต๋ณ€ ๋ฃจํ”„(Question-Entailment Answering Loop). ์ด ๋ฃจํ”„๋ฅผ ํ†ตํ•ด ์™ธ๋ถ€ ๋…ผ๊ฑฐ๋ฅผ ๋ชจ๋ธ ์ฒ˜๋ฆฌ ๊ณผ์ •์— ํ†ตํ•ฉํ–ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, Wu et al. (2024) [126]๋Š” ์ž„์ƒ ๊ธฐ๋ก์—์„œ ๋ฐœ์ƒํ•˜๋Š” ์˜ค๋ฅ˜ ์œ ํ˜•์„ ์ˆ˜๋™์œผ๋กœ ๋ถ„์„ํ•˜๊ณ , GPT-4 ๋ชจ๋ธ [127]์ด ๊ฐœ์ž…, ์ง„๋‹จ, ๊ด€๋ฆฌ ์˜ค๋ฅ˜์— ์ดˆ์ ์„ ๋งž์ถ”๋„๋ก ์œ ๋„ํ•˜๋Š” ์„ธ ๊ฐ€์ง€ CoT ํ”„๋กฌํ”„ํŠธ๋ฅผ ๊ฐœ๋ฐœํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ๋งž์ถคํ˜• ํ”„๋กฌํ”„ํŠธ๋Š” ์ž„์ƒ ๊ธฐ๋ก์—์„œ ์ž๋™ ์˜ค๋ฅ˜ ๊ฐ์ง€, ์ŠคํŒฌ ์‹๋ณ„, ์ˆ˜์ • ์ž‘์—…์„ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค.

์ˆ˜๋™ CoT ํ”„๋กฌํ”„ํŠธ ์„ค๊ณ„๋Š” ๋งค์šฐ ํšจ๊ณผ์ ์ด์ง€๋งŒ, ์ƒ๋‹นํ•œ ์ธ์  ์ž์›๊ณผ ์‹œ๊ฐ„์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด Automate-CoT [128]๋Š” ์ตœ์†Œํ•œ์˜ ๋ ˆ์ด๋ธ”๋ง์ด ๋œ ๋ฐ์ดํ„ฐ์…‹์„ ์‚ฌ์šฉํ•˜์—ฌ ๋…ผ๊ฑฐ ์ฒด์ธ์„ ์ฆ๊ฐ•ํ•˜๋Š” ๊ธฐ์ˆ ์„ ์ œ์•ˆํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ์ ‘๊ทผ๋ฒ•์€ ๋ถ„์‚ฐ ๊ฐ์†Œ ์ •์ฑ… ๊ฒฝ์‚ฌ(variance-reduced policy gradient) ์ „๋žต์„ ์‚ฌ์šฉํ•ด ๊ฐ CoT ์ฒด์ธ์˜ ์ค‘์š”์„ฑ์„ ํ‰๊ฐ€ํ•˜๋ฉฐ, ๊ฐ€์žฅ ํšจ๊ณผ์ ์ธ ํ”„๋กฌํ”„ํŠธ ์กฐํ•ฉ์„ ์„ ํƒํ•  ์ˆ˜ ์žˆ๋„๋ก ์ง€์›ํ•ฉ๋‹ˆ๋‹ค.

Chain of Thoughts ํ”„๋กฌํ”„ํŒ…์„ ํ™œ์šฉํ•˜๋Š” ๋˜ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•์€ LLM์„ ์ค‘์‹ฌ์œผ๋กœ ์—์ด์ „ํŠธ ์›Œํฌํ”Œ๋กœ์šฐ๋ฅผ ๊ตฌ์ถ•ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด๋Š” ๋‹ค์–‘ํ•œ ์‹ค์ œ ์‹œ๋‚˜๋ฆฌ์˜ค๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ๋ณด๋‹ค ํฌ๊ด„์ ์ธ ์‹œ์Šคํ…œ ๊ฐœ๋ฐœ์„ ์š”๊ตฌํ•ฉ๋‹ˆ๋‹ค. **Wang et al.**์— ๋”ฐ๋ฅด๋ฉด, ์ด๋Ÿฌํ•œ ์‹œ์Šคํ…œ์€ ํ”„๋กœํŒŒ์ผ๋ง(profiling), ๋ฉ”๋ชจ๋ฆฌ(memory), ๊ณ„ํš(planning), ํ–‰๋™(action) ๋ชจ๋“ˆ๋กœ ํฌ๊ฒŒ ๊ตฌ๋ถ„๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค [129]. ํ•ด์„ ๊ฐ€๋Šฅํ•œ ๋…ผ๊ฑฐ๋Š” ๋‹ค์–‘ํ•œ ํ˜•ํƒœ๋กœ ์—ฌ๋Ÿฌ ๋ชจ๋“ˆ์— ํ†ตํ•ฉ๋  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ด๋ฅผ ํ†ตํ•ด ์—์ด์ „ํŠธ๊ฐ€ ํ™˜๊ฒฝ ๋˜๋Š” ์ธ๊ฐ„์˜ ํ”ผ๋“œ๋ฐฑ์— ๋”ฐ๋ผ ์ ์‘ํ•˜๊ณ  ๋ฐ˜๋ณตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ตœ๊ทผ ์—ฐ๊ตฌ์—์„œ๋Š” ์ถ”๋ก  ์ฒด์ธ์˜ ํ’ˆ์งˆ์„ ์ž๋™์œผ๋กœ ํ‰๊ฐ€ํ•˜๋Š” ๋ฐฉ๋ฒ•๋ก ์ด ๋ฐœ์ „ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. LLM Reasoners [130]์™€ SocREval [131]๊ณผ ๊ฐ™์€ ์ตœ์‹  ๊ธฐ์ˆ ์€ ์ด๋Ÿฌํ•œ ํ‰๊ฐ€๋ฅผ ํ†ตํ•ด ๊ฐ•๋ ฅํ•œ ๋ฐ์ดํ„ฐ ์ฆ๊ฐ• ๊ธฐ๋ฐ˜ LLM ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ๊ตฌ์ถ•ํ•˜๋Š” ๋ฐ ๊ธฐ์—ฌํ•ฉ๋‹ˆ๋‹ค. ์ด ๋ฐฉ๋ฒ•๋ก ๋“ค์€ ๋…ผ๊ฑฐ ์ฒด์ธ์˜ ํ’ˆ์งˆ์„ ๋ณด์žฅํ•˜๊ณ , ๋” ๋‚˜์€ ์„ฑ๋Šฅ์˜ LLM ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ ๊ฐœ๋ฐœ์„ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค.

ํ•ด์„ ๊ฐ€๋Šฅํ•œ ๋…ผ๊ฑฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์€ ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์—์„œ ํ™œ์šฉ๋˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, CoML [132]์€ AutoML ์ง€์‹์„ ํ”„๋กฌํ”„ํŠธ๋กœ LLM์— ํ†ตํ•ฉํ•˜๊ณ , ๊ณผ๊ฑฐ ์‹คํ—˜ ๊ธฐ๋ก์—์„œ ์œ ์šฉํ•œ ์ •๋ณด๋ฅผ ๋™์ ์œผ๋กœ ๊ฒ€์ƒ‰ํ•œ ํ›„ ์ด๋ฅผ ๊ฒฐํ•ฉํ•˜์—ฌ LLM์ด ์ƒˆ๋กœ์šด ์ž‘์—…์„ ์œ„ํ•œ ๋จธ์‹ ๋Ÿฌ๋‹ ์†”๋ฃจ์…˜์„ ๊ฐœ๋ฐœํ•  ์ˆ˜ ์žˆ๋„๋ก ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. MetaGPT [133]๋Š” ์†Œํ”„ํŠธ์›จ์–ด ๊ฐœ๋ฐœ์„ ์œ„ํ•œ ๋‹ค์ค‘ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์„ ๊ฐœ๋ฐœํ–ˆ์œผ๋ฉฐ, ํ”„๋กœ์ ํŠธ ๋‚ด ๋‹ค์–‘ํ•œ ์ดํ•ด๊ด€๊ณ„์ž๋ฅผ ๊ฐ๊ฐ ์—์ด์ „ํŠธ๋กœ ํ‘œํ˜„ํ•ฉ๋‹ˆ๋‹ค. ์ด ์‹œ์Šคํ…œ์€ ์—ฌ๋Ÿฌ ์—์ด์ „ํŠธ๊ฐ€ ์‹ค์ œ ์—…๋ฌด ํŒŒ์ดํ”„๋ผ์ธ์— ๋”ฐ๋ผ ํ˜‘์—…ํ•˜์—ฌ ์†Œํ”„ํŠธ์›จ์–ด ๊ฐœ๋ฐœ ์ž‘์—…์„ ํšจ๊ณผ์ ์œผ๋กœ ์™„๋ฃŒํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•ฉ๋‹ˆ๋‹ค.

์ด์™€ ์œ ์‚ฌํ•˜๊ฒŒ, ๊ณ ๋„ํ™”๋œ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์€ ๊ณ ๊ฐ ์„œ๋น„์Šค [134] ๋ฐ ์˜๋ฃŒ ์งˆ๋ฌธ ์‘๋‹ต [135]๊ณผ ๊ฐ™์€ ๋ถ„์•ผ์—์„œ๋„ ์„ค๊ณ„๋˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋„๋ฉ”์ธ์—์„œ ์—์ด์ „ํŠธ๋Š” ํŠน์ • ์œ ํ˜•์˜ ์š”์ฒญ์„ ์ฒ˜๋ฆฌํ•˜๋„๋ก ๋งž์ถค ์„ค๊ณ„๋˜๋ฉฐ, ์ด๋Š” ๋ณต์žกํ•œ ์‚ฌ์šฉ์ž ์š”์ฒญ์„ ์ดํ•ดํ•˜๊ฑฐ๋‚˜ ์ •ํ™•ํ•œ ์˜๋ฃŒ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•˜๋Š” ์ž‘์—…์„ ํฌํ•จํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์‹œ์Šคํ…œ์€ ์ƒํ˜ธ์ž‘์šฉ์˜ ํ’ˆ์งˆ์„ ํ–ฅ์ƒ์‹œํ‚ฌ ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ์‘๋‹ต์˜ ํšจ์œจ์„ฑ๊ณผ ์ •ํ™•์„ฑ์„ ๋†’์ด๋ฉฐ, ์ž˜ ์„ค๊ณ„๋œ ์—์ด์ „ํŠธ ์›Œํฌํ”Œ๋กœ์šฐ์— LLM์„ ํ†ตํ•ฉํ–ˆ์„ ๋•Œ ๊ทธ ์œ ์—ฐ์„ฑ๊ณผ ์ž ์žฌ๋ ฅ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

6. Hidden Rationale Queries (L4)

6.1 Overview

์ˆจ๊ฒจ์ง„ ๋…ผ๊ฑฐ ์งˆ์˜๋Š” ํ•ด๊ฒฐํ•˜๊ธฐ ๊ฐ€์žฅ ์–ด๋ ค์šด ์œ ํ˜•์˜ ์งˆ์˜์— ์†ํ•ฉ๋‹ˆ๋‹ค. ํ•ด์„ ๊ฐ€๋Šฅํ•œ ๋…ผ๊ฑฐ ์งˆ์˜๊ฐ€ ๋ช…ํ™•ํ•œ ์ง€์นจ์„ ์ œ๊ณตํ•˜์—ฌ ์งˆ์˜์— ์‘๋‹ตํ•˜๋Š” ๋ฐ ํ•„์š”ํ•œ ๋…ผ๊ฑฐ๋ฅผ ๋ช…์‹œ์ ์œผ๋กœ ์ œ์‹œํ•˜๋Š” ๊ฒƒ๊ณผ ๋‹ฌ๋ฆฌ, ์ˆจ๊ฒจ์ง„ ๋…ผ๊ฑฐ ์งˆ์˜๋Š” ๋ช…์‹œ์ ์œผ๋กœ ์„ค๋ช…๋˜์ง€ ์•Š๊ณ  ๋งค์šฐ ๋‹ค์–‘ํ•˜๋ฉฐ, ๋ชจ๋“  ๊ฒฝ์šฐ๋ฅผ ๋‹ค ๋‹ค๋ฃจ๊ธฐ์—๋Š” ๋„ˆ๋ฌด ๋ฐฉ๋Œ€ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋…ผ๊ฑฐ๋Š” ์ผ๋ฐ˜์ ์ธ ์ปจํ…์ŠคํŠธ ์œˆ๋„์šฐ ๋‚ด์—์„œ ์™„์ „ํžˆ ํƒ๊ตฌํ•  ์ˆ˜ ์—†์„ ์ •๋„๋กœ ๊ด‘๋ฒ”์œ„ํ•˜๋ฉฐ, ๋ช…ํ™•ํ•œ ์ง€์นจ์ด ๋ถ€์กฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋ฐ์ดํ„ฐ ๋‚ด์— ์•”๋ฌต์ ์œผ๋กœ ํฌํ•จ๋œ ํ˜•ํƒœ์˜ ๋„๋ฉ”์ธ ์ „๋ฌธ์„ฑ์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค. ์ด์™€ ๊ฐ™์€ ๋ฐ์ดํ„ฐ์—๋Š” ๋‹ค์Œ์ด ํฌํ•จ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค:

  • In Domain Data : ์ˆจ๊ฒจ์ง„ ๋…ผ๊ฑฐ ์งˆ์˜๋Š” ๋™์ผํ•œ ๋„๋ฉ”์ธ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๊ณผ๊ฑฐ์˜ ์งˆ๋ฌธ-์‘๋‹ต ๊ธฐ๋ก์ด๋‚˜ ์ธ์œ„์ ์œผ๋กœ ์ƒ์„ฑ๋œ ๋ฐ์ดํ„ฐ๊ฐ€ ์ด์— ํ•ด๋‹นํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋„๋ฉ”์ธ ๋‚ด๋ถ€ ๋ฐ์ดํ„ฐ๋Š” ํ˜„์žฌ ์งˆ์˜๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๋ฐ ํ•„์š”ํ•œ ์ถ”๋ก  ๊ธฐ์ˆ ์ด๋‚˜ ๋ฐฉ๋ฒ•๋ก ์„ ๋ณธ์งˆ์ ์œผ๋กœ ํฌํ•จํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, Python ํ”„๋กœ๊ทธ๋ž˜๋ฐ ํผ์ฆ๊ณผ ๊ฐ™์€ ๋งฅ๋ฝ์—์„œ๋Š” ๊ณผ๊ฑฐ ๋ฌธ์ œ์˜ ํ•ด๊ฒฐ์ฑ…์— ํฌํ•จ๋œ ๊ณ ์ „ ์•Œ๊ณ ๋ฆฌ์ฆ˜๊ณผ ๋ฌธ์ œ ํ•ด๊ฒฐ ์ „๋žต์ด ํ˜„์žฌ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๋ฐ ๋„์›€์ด ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

  • Preliminary Knowledge : ์ˆจ๊ฒจ์ง„ ๋…ผ๊ฑฐ์˜ ๋˜ ๋‹ค๋ฅธ ํ˜•ํƒœ๋Š” ๋‹ค์–‘ํ•œ ์‹œ๋‚˜๋ฆฌ์˜ค์— ๋”ฐ๋ผ ์ ์šฉ๋˜๋Š” ๋ฐฉ๋Œ€ํ•œ ๋ถ„์‚ฐ ์ง€์‹ ๊ธฐ๋ฐ˜์ž…๋‹ˆ๋‹ค. ์ด ๊ธฐ์ดˆ ์ง€์‹์€ ๋ฒ•์  ํŒ๋‹จ์˜ ๊ทผ๊ฐ„์ด ๋˜๋Š” ๋ชจ๋“  ์ง€์—ญ ๋ฒ•๋ฅ ๊ณผ ๊ฐ™์€ ํฌ๊ด„์ ์ธ ๊ณต๋ฆฌ์  ์‹œ์Šคํ…œ์„ ํฌํ•จํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ์ˆ˜ํ•™์  ์ฆ๋ช…๊ณผ ๊ฐ™์€ ๋ถ„์•ผ์—์„œ ์ถ”๋ก  ๊ณผ์ •์„ ๋‹จ์ˆœํ™”ํ•˜๋Š” ๋ฐ ๋„์›€์ด ๋˜๋Š” ๊ฒ€์ฆ๋œ ์ค‘๊ฐ„ ๊ฒฐ๋ก ์„ ํฌํ•จํ•  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค. ํ˜„์‹ค ์„ธ๊ณ„์˜ ๋ฌธ์ œ๋ฅผ ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•ด ํ•ด๊ฒฐํ•  ๋•Œ, ์ด๋Ÿฌํ•œ ๊ธฐ์ดˆ ์ง€์‹์€ ์ธ๊ฐ„ ๊ฒฝํ—˜๊ณผ ์‹ค์ฆ์  ์š”์•ฝ์˜ ๋ณต์žกํ•œ ์ถ•์ ์—์„œ ๋น„๋กฏ๋  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค.

์ˆจ๊ฒจ์ง„ ๋…ผ๊ฑฐ ์งˆ์˜๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ ์†Œ์Šค์— ๋‚ด์žฌ๋œ ์ž ์žฌ์  ์ง€ํ˜œ๋ฅผ ํ•ด๋…ํ•˜๊ณ  ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ์ •๊ตํ•œ ๋ถ„์„ ๊ธฐ๋ฒ•์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” RAG(๊ฒ€์ƒ‰-์ƒ์„ฑ ๊ฒฐํ•ฉ) ์‹œ์Šคํ…œ์ด ๋ณต์žกํ•˜๊ณ  ์•”์‹œ์ ์ธ ์ •๋ณด๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ํ•ด์„ํ•˜๊ณ  ์ ์šฉํ•˜๋Š” ๋ฐ ์žˆ์–ด ์ƒ๋‹นํ•œ ๋„์ „์„ ์ œ๊ธฐํ•ฉ๋‹ˆ๋‹ค.

ํ•ด๋‹น ๋ ˆ๋ฒจ์˜ ์งˆ์˜ ์˜ˆ์‹œ

  • ๊ฒฝ์ œ ์ƒํ™ฉ์ด ํšŒ์‚ฌ์˜ ๋ฏธ๋ž˜ ๋ฐœ์ „์— ์–ด๋–ค ์˜ํ–ฅ์„ ๋ฏธ์น ๊นŒ์š”? (์žฌ๋ฌด ๋ณด๊ณ ์„œ ๋ชจ์Œ์ด ์ฃผ์–ด์กŒ์œผ๋ฉฐ, ๊ฒฝ์ œ์  ๋ฐ ์žฌ๋ฌด์  ๋…ผ๊ฑฐ๊ฐ€ ์š”๊ตฌ๋จ)

  • ์ˆซ์ž 5, 5, 5, 1์„ ์‚ฌ์šฉํ•˜์—ฌ 24๋ฅผ ๋งŒ๋“œ๋Š” ๋ฐฉ๋ฒ•์€ ๋ฌด์—‡์ธ๊ฐ€์š”? (24ํฌ์ธํŠธ ๊ฒŒ์ž„ ์˜ˆ์ œ์™€ ํ•ด๋‹น ๋‹ต์•ˆ์ด ์ฃผ์–ด์ง„ ๊ฒฝ์šฐ)

  • ์•„ํ”„๊ฐ€๋‹ˆ์Šคํƒ„์—์„œ๋Š” ๋ถ€๋ชจ๊ฐ€ ํ•ด์™ธ์—์„œ ํƒœ์–ด๋‚œ ์ž๋…€์—๊ฒŒ ์‹œ๋ฏผ๊ถŒ์„ ๋ถ€์—ฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ? (GLOBALCIT ์‹œ๋ฏผ๊ถŒ ๋ฒ•๋ฅ  ๋ฐ์ดํ„ฐ์…‹ [136]์ด ์ฃผ์–ด์ง„ ๊ฒฝ์šฐ)

6.2 Challenges and Solutions

์ˆจ๊ฒจ์ง„ ๋…ผ๊ฑฐ ์งˆ์˜๋Š” ๋ฐ์ดํ„ฐ ์ฆ๊ฐ• LLM ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ ๊ตฌ์ถ•์— ์žˆ์–ด ์ƒ๋‹นํ•œ ๋„์ „์„ ์ œ๊ธฐํ•˜๋ฉฐ, ์ฃผ์š” ์–ด๋ ค์›€์€ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์˜์—ญ์—์„œ ๋‚˜ํƒ€๋‚ฉ๋‹ˆ๋‹ค:

  • Logical Retrieval : ์ˆจ๊ฒจ์ง„ ๋…ผ๊ฑฐ๋ฅผ ํฌํ•จํ•˜๋Š” ์งˆ๋ฌธ์—์„œ๋Š” ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ์˜ ์œ ์šฉ์„ฑ์ด ๋‹จ์ˆœํžˆ ๊ฐœ์ฒด ์ˆ˜์ค€์˜ ์œ ์‚ฌ์„ฑ์ด๋‚˜ ์˜๋ฏธ์  ์œ ์‚ฌ์„ฑ์— ์˜์กดํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๋Œ€์‹ , ๋…ผ๋ฆฌ์  ์ผ๊ด€์„ฑ์ด๋‚˜ ์ฃผ์ œ์  ์ •๋ ฌ์ด ๋” ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ์ผ๋ฐ˜์ ์ธ ๊ฒ€์ƒ‰ ๋ฐฉ๋ฒ•์€ ์งˆ์˜์˜ ์‹ค์ œ ๋ชฉํ‘œ๋ฅผ ํฌ์ฐฉํ•˜๊ฑฐ๋‚˜, ๋ฌธ์ œ์™€ ๋…ผ๋ฆฌ์ ์œผ๋กœ ์œ ์‚ฌํ•œ ํ…์ŠคํŠธ ๋ถ€๋ถ„์„ ์‹๋ณ„ํ•˜๋Š” ๋ฐ ์–ด๋ ค์›€์„ ๊ฒช๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋‹จ์ˆœํ•œ ํ…์ŠคํŠธ ์œ ์‚ฌ์„ฑ์— ์˜์กดํ•˜๋Š” ๋Œ€์‹ , ๊ธฐ๋ณธ ๋…ผ๋ฆฌ ๊ตฌ์กฐ๋ฅผ ๋ถ„์„ํ•˜๊ณ  ์‹๋ณ„ํ•  ์ˆ˜ ์žˆ๋Š” ๋ณด๋‹ค ์ •๊ตํ•œ ๊ฒ€์ƒ‰ ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ๊ฐœ๋ฐœ์„ ํ•„์š”๋กœ ํ•ฉ๋‹ˆ๋‹ค.

  • Data Insufficiency : ๊ธฐ๋ณธ์ ์œผ๋กœ ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๋Š” ํ˜„์žฌ ์งˆ์˜์™€ ๊ด€๋ จ๋œ ๋ช…ํ™•ํ•œ ์ง€์นจ์ด๋‚˜ ๋‹ต๋ณ€์„ ๋ช…์‹œ์ ์œผ๋กœ ํฌํ•จํ•˜์ง€ ์•Š์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋Œ€์‹ , ๊ด€๋ จ ์ •๋ณด๋Š” ์ข…์ข… ๋ถ„์‚ฐ๋œ ์ง€์‹์— ๋‚ด์žฌ๋˜์–ด ์žˆ๊ฑฐ๋‚˜ ์˜ˆ์‹œ๋ฅผ ํ†ตํ•ด ์•”์‹œ์ ์œผ๋กœ ์ œ์‹œ๋ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๊ฐ„์ ‘์ ์ธ ์ •๋ณด ํ‘œํ˜„์€ ๋ฐ์ดํ„ฐ ํ•ด์„ ๋ฐ ํ†ตํ•ฉ ๋Šฅ๋ ฅ์„ ์š”๊ตฌํ•˜๋ฉฐ, LLM์ด ๋‹จํŽธ์ ์ด๊ฑฐ๋‚˜ ๊ฐ„์ ‘์ ์œผ๋กœ ๊ด€๋ จ๋œ ๋ฐ์ดํ„ฐ ์†Œ์Šค์—์„œ ์ผ๊ด€๋œ ๋‹ต๋ณ€์„ ๋„์ถœํ•  ์ˆ˜ ์žˆ๋Š” ๊ฐ•๋ ฅํ•œ ์—ญ๋Ÿ‰์„ ํ•„์š”๋กœ ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋„์ „์€ ์ˆจ๊ฒจ์ง„ ๋…ผ๊ฑฐ ์งˆ์˜์˜ ๋ณต์žก์„ฑ์„ ํšจ๊ณผ์ ์œผ๋กœ ๋‹ค๋ฃจ๊ธฐ ์œ„ํ•ด LLM ํ”„๋ ˆ์ž„์›Œํฌ ๋‚ด์—์„œ ์ •๊ตํ•œ ๋ฐ์ดํ„ฐ ํ†ตํ•ฉ ๋ฐ ์ถ”๋ก  ์—ญ๋Ÿ‰์ด ํ•„์ˆ˜์ ์ž„์„ ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค.

6.3 Offline Learning

์ด๋Ÿฌํ•œ ์œ ํ˜•์˜ ์งˆ์˜๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ์ผ๋ฐ˜์ ์œผ๋กœ ์‚ฌ์šฉํ•˜๋Š” ์ ‘๊ทผ๋ฒ•์€ ๋ฐ์ดํ„ฐ์…‹์—์„œ ๊ทœ์น™๊ณผ ๊ฐ€์ด๋“œ๋ฅผ ์˜คํ”„๋ผ์ธ์œผ๋กœ ์‹๋ณ„ํ•˜๊ณ  ์ถ”์ถœํ•œ ํ›„, ๊ด€๋ จ ํ•ญ๋ชฉ์„ ๊ฒ€์ƒ‰ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ถ”๋ก  ๋…ผ๊ฑฐ๋ฅผ ์ƒ์„ฑํ•˜๊ธฐ ์œ„ํ•ด, STaR [137]๊ณผ LXS [138]์™€ ๊ฐ™์€ ์—ฐ๊ตฌ๋Š” LLM์„ ํ™œ์šฉํ•˜์—ฌ ๋…ผ๊ฑฐ๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค.

STaR๋Š” ์†Œ๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹์—์„œ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ํ™•์žฅํ•˜๊ธฐ ์œ„ํ•ด ๋ฐ˜๋ณต์ ์ธ ์†Œ์ˆ˜ ์ƒ˜ํ”Œ(few-shot) ์˜ˆ์ œ ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ•˜๋ฉฐ, LXS๋Š” ํ•™์Šต ๋ชจ๋ธ์ด ์„ค๋ช…์„ ์ƒ์„ฑํ•˜๊ณ , ๋น„ํ‰ ๋ชจ๋ธ์ด ์ด๋ฅผ ํ‰๊ฐ€ํ•˜๊ณ  ๊ฒ€์ฆํ•˜๋Š” ๋‘ ๊ฐ€์ง€ ์—ญํ• ๋กœ ๊ตฌ์„ฑ๋œ ์„ค๋ช… ์ถ”์ถœ ๊ณผ์ •์„ ๋„์ž…ํ–ˆ์Šต๋‹ˆ๋‹ค.

GL [139]์€ ์˜ค๋ฅ˜๋ฅผ ์‹๋ณ„ํ•˜๊ณ  ์ด๋ฅผ ์ผ๋ฐ˜ํ™”ํ•˜์—ฌ ๋ฏธ๋ž˜ ์ž‘์—…์„ ์œ„ํ•œ ๊ฐ€์ด๋“œ๋ผ์ธ์œผ๋กœ ์ „ํ™˜ํ•˜๋ฉฐ, LEAP [140]์€ ์‹ค์ˆ˜, ์ €์ˆ˜์ค€ ์›์น™, ๊ณ ์ˆ˜์ค€ ์›์น™์„ ์ƒ์„ฑํ•ด ์ด๋ฅผ ํ”„๋กฌํ”„ํŠธ์— ํ†ตํ•ฉํ•˜์—ฌ ์ตœ์ข… ์ถ”๋ก ์— ํ™œ์šฉํ•ฉ๋‹ˆ๋‹ค. RICP [141]๋Š” ํ•™์Šต ๋ฐ์ดํ„ฐ์˜ ์‹ค์ˆ˜๋ฅผ ํ™œ์šฉํ•˜์—ฌ ๊ณ ์ˆ˜์ค€ ์ถ”๋ก  ๋ฐ ๊ตฌ์ฒด์ ์ธ ํ†ต์ฐฐ์„ ์ƒ์„ฑํ•œ ๋‹ค์Œ, ๊ณ„์ธต์  ํด๋Ÿฌ์Šคํ„ฐ๋ง์„ ์‚ฌ์šฉํ•ด ์˜ค๋ฅ˜ ์œ ํ˜•์„ ๊ทธ๋ฃนํ™”ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ์ž‘์—… ์ˆ˜์ค€๊ณผ ์งˆ๋ฌธ ์ˆ˜์ค€์˜ ์›์น™์„ ์ƒ์„ฑํ•˜๊ณ , ์ด๋ฅผ ๊ฒฐํ•ฉํ•ด ์งˆ๋ฌธ ์ˆ˜์ค€์˜ ํ†ต์ฐฐ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. Buffer-of-Thought [142]๋Š” ๋ฌธ์ œ๋ฅผ ์š”์•ฝ(distill)ํ•˜์—ฌ ์—ฌ๋Ÿฌ ์ถ”๋ก  ์ž‘์—…์„ ํ†ตํ•ฉํ•˜๋Š” ๋ฉ”ํƒ€ ๋ฒ„ํผ(meta-buffer)๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค.

ํ†ตํ•ฉ๋œ ๋ฐฉ๋ฒ• ์ค‘ ํ•˜๋‚˜์ธ MedPrompt [143]๋Š” GPT-4๊ฐ€ ์ƒ์„ฑํ•œ ์ถ”๋ก  ์ฒด์ธ์„ ํ•™์Šต ์˜ˆ์ œ๋กœ ํ™œ์šฉํ•˜๊ณ , ์ด๋ฅผ KNN ๊ธฐ๋ฐ˜ ์ธ์ปจํ…์ŠคํŠธ ํ•™์Šต ์ ‘๊ทผ๋ฒ•๊ณผ ๊ฒฐํ•ฉํ•ฉ๋‹ˆ๋‹ค. Agent Hospital [144]์€ ๋ฐ˜์„ฑ(reflection)์„ ํ†ตํ•ด ๋…ผ๊ฑฐ๋ฅผ ์ƒ์„ฑํ•˜๋ฉฐ, ์ƒ์„ฑ๋œ ๋ฐ์ดํ„ฐ์—์„œ ๊ธฐ๋ก ๊ฒ€์ƒ‰๊ณผ ๊ฒฝํ—˜ ๊ฒ€์ƒ‰์„ ํ™œ์šฉํ•ฉ๋‹ˆ๋‹ค.

์ด๋Ÿฌํ•œ ๊ฐœ๋…๋“ค์€ ๊ฐ€์ด๋“œ๋ผ์ธ, ์›์น™, ๊ฒฝํ—˜, ์‚ฌ๊ณ  ํ…œํ”Œ๋ฆฟ ๋“ฑ ๋‹ค์–‘ํ•œ ์ด๋ฆ„์œผ๋กœ ๋ถˆ๋ฆฌ์ง€๋งŒ, ํ•ต์‹ฌ ์•„์ด๋””์–ด๋Š” ๊ณตํ†ต์ ์œผ๋กœ ์œ ์šฉํ•œ ๋…ผ๊ฑฐ๋ฅผ ์ถ”์ถœํ•˜์—ฌ ์ถ”๋ก  ์งˆ์˜๋ฅผ ๊ฐ•ํ™”ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋…ผ๊ฑฐ๋Š” ์ž์ฒด ์ƒ์„ฑ๋œ ์‚ฌ๊ณ  ์ฒด์ธ(MedPrompt, Buffer-of-Thought), ํ•™์Šต ์„ธํŠธ์˜ ์‹ค์ˆ˜(GL, RICP, Agent Hospital), ๋˜๋Š” ์˜๋„์ ์œผ๋กœ ์ƒ์„ฑ๋œ ์‹ค์ˆ˜(LEAP)์—์„œ ๋น„๋กฏ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋˜ํ•œ, ์ผ๋ถ€ ์›์น™์€ ๋ชจ๋“  ์ž‘์—…์— ๊ฑธ์ณ ์‚ฌ์šฉ(Agent Hospital, RICP)๋˜๋Š” ๋ฐ˜๋ฉด, ๋‹ค๋ฅธ ์›์น™์€ ํŠน์ • ์งˆ๋ฌธ์— ๋งž๊ฒŒ ๋™์ ์œผ๋กœ ๊ฒ€์ƒ‰(MedPrompt, Buffer-of-Thought)๋ฉ๋‹ˆ๋‹ค. ๋งŽ์€ ์—ฐ๊ตฌ๋Š” ์‚ฌ๋ก€์—์„œ ํ•™์Šตํ•˜๊ณ  ๊ฒฝํ—˜์„ ๋…ผ๊ฑฐ๋กœ ์ถ•์ ํ•˜๋Š” ๊ฒƒ์ด ๋‹ค์–‘ํ•œ ์ถ”๋ก  ์ž‘์—…์— ์œ ์ตํ•˜๋‹ค๋Š” ์ ์„ ์ž…์ฆํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

6.4 In-Context Learning (ICL)

์ปจํ…์ŠคํŠธ ํ•™์Šต์—์„œ ์˜ˆ์ œ๋ฅผ ํ™œ์šฉํ•˜๋Š” ๊ฒƒ์€ ์ˆจ๊ฒจ์ง„ ๋…ผ๊ฑฐ๋ฅผ ํƒ๊ตฌํ•˜๋Š” ์ผ๋ฐ˜์ ์ธ ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค. ์‚ฌ์ „ ํ•™์Šต๋œ ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ(LLM)์€ ๊ฐ•๋ ฅํ•œ ์ธ์ปจํ…์ŠคํŠธ ํ•™์Šต(In-Context Learning, ICL) ๋Šฅ๋ ฅ์„ ๋ณด์ด๋ฉฐ, ์œ ์‚ฌ์„ฑ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์˜ˆ์ œ๋ฅผ ๊ฒ€์ƒ‰ํ•˜์—ฌ ๋ชจ๋ธ์˜ ์†Œ์ˆ˜ ์ƒ˜ํ”Œ ํ•™์Šต(few-shot learning) ๋Šฅ๋ ฅ์„ ๊ฐ•ํ™”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค [145, 146]. ๊ทธ๋Ÿฌ๋‚˜ ํ”„๋กฌํ”„ํŠธ์— ๊ด€๋ จ ์—†๋Š” ์ •๋ณด๊ฐ€ ํฌํ•จ๋  ๊ฒฝ์šฐ, LLM์ด ์‰ฝ๊ฒŒ ํ˜ผ๋ž€์„ ๊ฒช์–ด ๋ถ€์ •ํ™•ํ•œ ์‘๋‹ต์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค [147, 148]. Wu et al. [149]์ด ๊ฐœ๋ฐœํ•œ OpenICL์€ ๋‹ค์–‘ํ•œ ์ „ํ†ต์ ์ธ ์˜ˆ์ œ ๊ฒ€์ƒ‰ ๋ฐ ์ถ”๋ก  ๊ธฐ๋ฒ•์ด ์ธ์ปจํ…์ŠคํŠธ ํ•™์Šต์˜ ํšจ๊ณผ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ํƒ๊ตฌํ•˜๋Š” ICL ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๊ตฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค.

LLM์—์„œ ์ œ๊ณตํ•˜๋Š” ํ”ผ๋“œ๋ฐฑ์„ ๋ฐ”ํƒ•์œผ๋กœ ์†Œ๊ทœ๋ชจ ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•˜์—ฌ ์ปจํ…์ŠคํŠธ ์˜ˆ์ œ๋ฅผ ์„ ํƒํ•˜๊ณ , ํŠน์ • ์ž‘์—…์— ๋งž๋Š” ์ตœ์ ์˜ ์˜ˆ์ œ์™€ ๋ฐ๋ชจ๋ฅผ ๊ตฌ์„ฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค [150, 5, 151]. ๋˜ํ•œ, Su et al. [152]๋Š” ์‹ค์งˆ์ ์ธ ํ…Œ์ŠคํŠธ์— ํ•„์š”ํ•œ ๋” ๋„“์€ ์—ฐ๊ด€์„ฑ์„ ํฌ๊ด„ํ•˜์ง€ ๋ชปํ•˜๋Š” ์˜๋ฏธ์  ์œ ์‚ฌ์„ฑ ๊ธฐ๋ฐ˜ ์˜ˆ์ œ ๊ฒ€์ƒ‰์˜ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด vote-k๋ผ๋Š” ๋น„์ง€๋„ ํ•™์Šต ๊ธฐ๋ฐ˜ ๊ทธ๋ž˜ํ”„ ์„ ํƒ ์ฃผ์„ ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๋” ๋‹ค์–‘ํ•˜๊ณ  ๋Œ€ํ‘œ์ ์ธ ์˜ˆ์ œ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๋ฅผ ๊ตฌ์ถ•ํ•˜์—ฌ ์†Œ์ˆ˜ ์ƒ˜ํ”Œ ํ•™์Šต์„ ์ง€์›ํ–ˆ์Šต๋‹ˆ๋‹ค. Zhang et al. [153]์€ ๋‹ค์–‘ํ•œ ๋Œ€ํ‘œ ์œ ํ˜•์œผ๋กœ ์˜ˆ์ œ๋ฅผ ํด๋Ÿฌ์Šคํ„ฐ๋งํ•˜๋Š” Auto-CoT ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ๋ฐฉ๋ฒ•์€ ๋ฌธ์ œ๋ฅผ ๋‹ค์–‘ํ•˜๊ฒŒ ์ƒ˜ํ”Œ๋งํ•˜๊ณ  ์ถ”๋ก  ์ฒด์ธ์„ ์ƒ์„ฑํ•˜์—ฌ ํ•™์Šต ๊ณผ์ •์„ ๋” ํšจ๊ณผ์ ์œผ๋กœ ์ง€์›ํ•˜๋Š” ์˜ˆ์ œ๋ฅผ ๊ตฌ์„ฑํ•ฉ๋‹ˆ๋‹ค.

LLM์ด ํ›ˆ๋ จ๋œ ๋„๋ฉ”์ธ ์™ธ๋ถ€์—์„œ ์†Œ์ˆ˜ ์ƒ˜ํ”Œ ํ•™์Šต์„ ํ†ตํ•ด ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ์ตํžˆ๋Š” ๊ฒƒ์€ ์—ฌ์ „ํžˆ ํฐ ๋„์ „ ๊ณผ์ œ์ž…๋‹ˆ๋‹ค. **Wang et al.**์€ ๋‹ค์–‘ํ•œ ์ถ”๋ก  ๊ฒฝ๋กœ๋ฅผ ์ƒ˜ํ”Œ๋งํ•˜๊ณ , ์ด๋ฅผ ํ†ตํ•ด ๊ฐ€์žฅ ์ผ๊ด€๋œ ๋‹ต๋ณ€์„ ์„ ํƒํ•จ์œผ๋กœ์จ LLM์ด ์˜ฌ๋ฐ”๋ฅธ ์ถ”๋ก  ์ฒด์ธ์„ ์„ ํƒํ•  ํ™•๋ฅ ์„ ๋†’์ด๋Š” ๋ฐฉ์‹์„ ์ œ์•ˆํ–ˆ์Šต๋‹ˆ๋‹ค [154]. **Agarwal et al.**์€ ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•œ ์˜ˆ์ œ๋ฅผ ์ƒ์„ฑํ•˜๊ธฐ ์œ„ํ•œ ๋‘ ๊ฐ€์ง€ ํ™•์žฅ ๊ฐ€๋Šฅํ•œ ๋ฐฉ๋ฒ•(๊ฐ•ํ™” ICL ๋ฐ ๋น„์ง€๋„ ICL)์„ ์†Œ๊ฐœํ•˜์—ฌ, ์‚ฌ๋žŒ์ด ์ƒ์„ฑํ•œ ์˜ˆ์ œ๋ฅผ ๋Œ€์ฒดํ•˜๊ณ  ์˜ˆ์ œ ํ’€์ด ํ™•์žฅ๋  ์ˆ˜ ์žˆ๋„๋ก ํ–ˆ์Šต๋‹ˆ๋‹ค [155].

DIN-SQL [156]์€ ์ž‘์—…์„ ๋” ๋‹จ์ˆœํ•œ ํ•˜์œ„ ์ž‘์—…์œผ๋กœ ๋ถ„ํ•ดํ•˜๊ณ , ์ด ํ•˜์œ„ ๋ฌธ์ œ์˜ ์†”๋ฃจ์…˜์„ LLM์˜ ํ”„๋กฌํ”„ํŠธ๋กœ ์‚ฌ์šฉํ•˜์—ฌ ํ…์ŠคํŠธ์—์„œ SQL์„ ์ƒ์„ฑํ•˜๋Š” ์„ฑ๋Šฅ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œ์ผฐ์Šต๋‹ˆ๋‹ค. ๋น„์Šทํ•˜๊ฒŒ, DUP [157]๋Š” LLM์ด ์ฒด์ธ ์˜ค๋ธŒ ์‚ฌ๊ณ (CoT)๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋ณต์žกํ•œ ์ˆ˜ํ•™์  ๋‹จ์–ด ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•  ๋•Œ ์ง๋ฉดํ•˜๋Š” ์ฃผ์š” ์„ธ ๊ฐ€์ง€ ๋ฌธ์ œ(์˜๋ฏธ์  ์˜คํ•ด, ๊ณ„์‚ฐ ์˜ค๋ฅ˜, ๋ˆ„๋ฝ๋œ ๋‹จ๊ณ„)๋ฅผ ํ™•์ธํ–ˆ์Šต๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ ์˜๋ฏธ์  ์˜คํ•ด๊ฐ€ ์ฃผ์š” ์ œํ•œ ์š”์ธ์œผ๋กœ ์ง€์ ๋˜์—ˆ์œผ๋ฉฐ, ๋ฌธ์ œ๋ฅผ ๊นŠ์ด ์ดํ•ดํ•˜๊ณ  ํ•ด๊ฒฐ์— ํ•„์š”ํ•œ ํ•ต์‹ฌ ์ •๋ณด๋ฅผ ์ถ”์ถœํ•˜๋„๋ก LLM์„ ์œ ๋„ํ•จ์œผ๋กœ์จ ์ˆ˜ํ•™ ๋ฌธ์ œ ํ•ด๊ฒฐ ๋Šฅ๋ ฅ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ๋‹ค๊ณ  ์„ค๋ช…ํ–ˆ์Šต๋‹ˆ๋‹ค.

6.5 Fine Tuning

LLM(๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ)์˜ ๊ฐ•๋ ฅํ•œ In-Context ํ•™์Šต ๋Šฅ๋ ฅ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ , ๋ณต์žกํ•˜๊ณ  ๊ธด ๋…ผ๋ฆฌ ์ฒด์ธ์„ ์œ„ํ•œ ์ตœ์ ์˜ ๋…ผ๊ฑฐ๋‚˜ ์˜ˆ์ œ๋ฅผ ์ •ํ™•ํžˆ ์‹๋ณ„ํ•˜๋Š” ๊ฒƒ์€ ์—ฌ์ „ํžˆ ์ค‘์š”ํ•œ ๋„์ „ ๊ณผ์ œ๋กœ ๋‚จ์•„ ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ๋ฐฉ๋Œ€ํ•œ ์™ธ๋ถ€ ์‚ฌ์ „ ์ง€์‹์„ ์ œ๊ณตํ•˜๋Š” ๊ณผ์ •์—์„œ LLM์˜ ์ถ”๋ก  ๋Šฅ๋ ฅ์ด ์ œํ•œ๋  ์ˆ˜ ์žˆ๋Š” ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋ฅผ ๊ณ ๋ คํ•  ๋•Œ, **ํŒŒ์ธํŠœ๋‹(fine-tuning)**์€ ์œ ๋งํ•œ ์ ‘๊ทผ๋ฒ•์œผ๋กœ ๋ถ€๊ฐ๋ฉ๋‹ˆ๋‹ค. ํŒŒ์ธํŠœ๋‹์€ LLM์ด ์‚ฌ์ „ ํ•™์Šต(pre-training) ๋™์•ˆ ํš๋“ํ•œ ๊ด‘๋ฒ”์œ„ํ•œ ๊ธฐ์ดˆ ์ง€์‹์„ ํ™œ์šฉํ•  ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ, ์ƒˆ๋กœ์šด ๋„๋ฉ”์ธ์˜ ๋…ผ๊ฑฐ๋ฅผ ๋น ๋ฅด๊ฒŒ ์Šต๋“ํ•  ์ˆ˜ ์žˆ๋„๋ก ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด LLM์ด ๊ณ ๊ธ‰ ๋ฐ ํŠนํ™”๋œ ์ž‘์—…์„ ์ฒ˜๋ฆฌํ•˜๋Š” ๋ฐ ํ•„์š”ํ•œ ์ ์‘์„ฑ๊ณผ ํšจ๊ณผ์„ฑ์„ ํ–ฅ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ๋Š” ์‹ค์งˆ์ ์ธ ๋ฐฉ์•ˆ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

  • Instruction Tuning : ์ธ์ŠคํŠธ๋Ÿญ์…˜ ํŠœ๋‹์€ LLM์— ์ƒˆ๋กœ์šด ๊ธฐ๋Šฅ์„ ์ฃผ์ž…ํ•˜๋Š” ์ผ๋ฐ˜์ ์ธ ๋ฐฉ๋ฒ•์œผ๋กœ, ์ฃผ๋กœ (์ง€์‹œ๋ฌธ, ์ถœ๋ ฅ) ์Œ ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•œ ์ง€๋„ํ•™์Šต ๊ธฐ๋ฐ˜์˜ ํŒŒ์ธํŠœ๋‹์„ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค. ์ธ์ŠคํŠธ๋Ÿญ์…˜ ๋ฐ์ดํ„ฐ์…‹์„ ๊ตฌ์„ฑํ•˜๋Š” ์ฃผ์š” ๋ฐฉ๋ฒ•์€ ๋‹ค์Œ ์„ธ ๊ฐ€์ง€์ž…๋‹ˆ๋‹ค:

    • a) ๊ธฐ์กด ๋ฐ์ดํ„ฐ์…‹์—์„œ ์ถ”์ถœ [161, 162]

    • b) ์ˆ˜์ž‘์—…์œผ๋กœ ์ง€์‹œ๋ฌธ์„ ์ œ์ž‘ [163, 164, 165]

    • c) ๊ฐ•๋ ฅํ•œ LLM์„ ์‚ฌ์šฉํ•˜์—ฌ ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑ [166, 154]

    ๋˜ํ•œ, ์—ฌ๋Ÿฌ ์—ฐ๊ตฌ [167, 168, 169]๋Š” ์ธ์ŠคํŠธ๋Ÿญ์…˜ ๋ฐ์ดํ„ฐ์…‹ ๋‚ด ๋ฐ์ดํ„ฐ ๋ถ„ํฌ๋ฅผ ์ตœ์ ํ™”ํ•˜์—ฌ ํŒŒ์ธํŠœ๋‹์˜ ํšจ๊ณผ๋ฅผ ๋†’์ด๋Š” ๋ฐฉ๋ฒ•์„ ํƒ๊ตฌํ–ˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ, ๋ฐ์ดํ„ฐ ์ฆ๊ฐ• ๊ธฐ๋ฐ˜ LLM ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ๊ตฌ์ถ•ํ•  ๋•Œ, ํŒŒ์ธํŠœ๋‹์€ ์—ฌ์ „ํžˆ ์‹œ๊ฐ„ ๋ฐ ๊ณ„์‚ฐ ์ž์› ์ธก๋ฉด์—์„œ ๋น„๊ต์  ๋น„์šฉ์ด ๋งŽ์ด ๋“œ๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ ๊ฐ„์ฃผ๋ฉ๋‹ˆ๋‹ค.

  • ํŒŒ์ธํŠœ๋‹ ๋น„์šฉ ์ ˆ๊ฐ ๋ฐฉ์•ˆ : ์ตœ๊ทผ์—๋Š” ๋Œ€ํ˜• ๋ชจ๋ธ์˜ ํŒŒ์ธํŠœ๋‹ ๋น„์šฉ์„ ์ค„์ด๊ธฐ ์œ„ํ•œ ์—ฌ๋Ÿฌ ๋…ธ๋ ฅ์ด ์ด๋ฃจ์–ด์กŒ์Šต๋‹ˆ๋‹ค. ๋Œ€ํ‘œ์ ์ธ ๋ฐฉ๋ฒ•์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:

    • ์–ด๋Œ‘ํ„ฐ ํŠœ๋‹(Adapter Tuning) : LLM์˜ ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ๊ณ ์ •(freezing)ํ•œ ์ƒํƒœ์—์„œ ์†Œ๊ทœ๋ชจ ์–ด๋Œ‘ํ„ฐ ๋ชจ๋ธ์„ ํ†ตํ•ฉํ•˜๊ณ , ํŒŒ์ธํŠœ๋‹ ์‹œ ์–ด๋Œ‘ํ„ฐ์˜ ๊ฐ€์ค‘์น˜๋งŒ ์ตœ์ ํ™”ํ•˜๋Š” ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค [170, 171, 172, 173].

    • ํ”„๋ฆฌํ”ฝ์Šค ํŠœ๋‹(Prefix Tuning) ๋ฐ ํ”„๋กฌํ”„ํŠธ ํŠœ๋‹(Prompt Tuning) : ์ž…๋ ฅ ์•ž์— ํ•™์Šต ๊ฐ€๋Šฅํ•œ ๋ฒกํ„ฐ ์ง‘ํ•ฉ์„ ์ถ”๊ฐ€ํ•˜๊ณ , ์ด๋ฅผ ํ›ˆ๋ จ ์ค‘์— ์ตœ์ ํ™”ํ•˜์—ฌ LLM์˜ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค [174, 175, 176, 177, 178].

    • ์ €๋žญํฌ ์ ์‘(Low-Rank Adaptation, LoRA) : ๊ฐ ๋ฐ€์ง‘ ๊ณ„์ธต(dense layer)์— ์ €๋žญํฌ ์ œ์•ฝ์„ ๊ฐ€ํ•ด ์—…๋ฐ์ดํŠธ ํ–‰๋ ฌ์„ ๊ทผ์‚ฌํ•จ์œผ๋กœ์จ, ํ•˜์œ„ ์ž‘์—…์— ์ ์‘ํ•˜๋Š” ๋ฐ ํ•„์š”ํ•œ ํ•™์Šต ๊ฐ€๋Šฅํ•œ ๋งค๊ฐœ๋ณ€์ˆ˜ ์ˆ˜๋ฅผ ์ค„์ด๋Š” ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค [179, 180, 181, 182, 183].

์ตœ๊ทผ ๋ช‡ ๋…„๊ฐ„, supervised fine-tuning์„ ํ™œ์šฉํ•˜์—ฌ LLM(๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ)์˜ ํŠนํ™”๋œ ๋„๋ฉ”์ธ ๋Šฅ๋ ฅ์„ ๊ฐ•ํ™”ํ•˜๋Š” ์—ฐ๊ตฌ๊ฐ€ ํ™œ๋ฐœํžˆ ์ด๋ฃจ์–ด์กŒ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์ˆ˜ํ•™์  ์ถ”๋ก , ๊ธˆ์œต, ๋ฒ•๋ฅ , ์˜๋ฃŒ์™€ ๊ฐ™์€ ์ „๋ฌธ ๋ถ„์•ผ์—์„œ ๋‘๋“œ๋Ÿฌ์ง„ ์„ฑ๊ณผ๋ฅผ ๋ณด์ด๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค [184, 185, 186]. ์˜ˆ๋ฅผ ๋“ค์–ด: ChatTimeLlama [187]๋Š” ํ•ด์„ ๊ฐ€๋Šฅํ•œ ์‹œ๊ฐ„ ์ถ”๋ก  ์ง€์‹œ๋ฌธ ํŠœ๋‹ ๋ฐ์ดํ„ฐ์…‹์„ ๋„์ž…ํ•˜๊ณ , LLaMA [188]์— ํŒŒ์ธํŠœ๋‹์„ ์ ์šฉํ•˜์—ฌ ๋ชจ๋ธ์˜ ๋ณต์žกํ•œ ์‹œ๊ฐ„์  ์ถ”๋ก , ๋ฏธ๋ž˜ ์‚ฌ๊ฑด ์˜ˆ์ธก ๋Šฅ๋ ฅ ๋ฐ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œ์ผฐ์Šต๋‹ˆ๋‹ค. LISA [189]๋Š” ์†Œ๊ทœ๋ชจ ์ถ”๋ก  ๊ด€๋ จ ์„ธ๊ทธ๋จผํŠธ ๋ฐ์ดํ„ฐ ์ƒ˜ํ”Œ์„ ํ™œ์šฉํ•ด ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM์ธ LLaVA๋ฅผ ํŒŒ์ธํŠœ๋‹ํ•˜์—ฌ ์ถ”๋ก  ์„ธ๊ทธ๋จผํŠธ ๋Šฅ๋ ฅ์„ ํฌ๊ฒŒ ๊ฐœ์„ ํ–ˆ์Šต๋‹ˆ๋‹ค. MAmmoTH [190]๋Š” Chain of Thought(CoT)์™€ Program of Thought ์ถ”๋ก ์„ ๋…์ฐฝ์ ์œผ๋กœ ๊ฒฐํ•ฉํ•œ ์ˆ˜ํ•™ ์˜ˆ์ œ ๋ฐ์ดํ„ฐ์…‹์„ ๊ตฌ์ถ•ํ•ด, ๋‹ค์–‘ํ•œ ์ˆ˜ํ•™์  ๋„๋ฉ”์ธ์„ ํฌ๊ด„ํ•˜๊ณ  ์ผ๋ฐ˜์ ์ธ ์ˆ˜ํ•™ ๋ฌธ์ œ ํ•ด๊ฒฐ ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œ์ผฐ์Šต๋‹ˆ๋‹ค. ReFT [191]๋Š” ๋™์ผํ•œ ๋ฌธ์ œ์— ๋Œ€ํ•œ ์—ฌ๋Ÿฌ ์ฃผ์„๋œ ์ถ”๋ก  ๊ฒฝ๋กœ๋ฅผ ํ•™์Šตํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ๋ฐฉ๋ฒ•์€ ์ˆ˜ํ•™ ๋ฌธ์ œ์— ๋Œ€ํ•ด ๋‹ค์–‘ํ•œ ์ถ”๋ก  ๊ฒฝ๋กœ๋ฅผ ์ž๋™์œผ๋กœ ์ƒ˜ํ”Œ๋งํ•˜๊ณ , ์ •๋‹ต์„ ํ™œ์šฉํ•ด ๋ณด์ƒ ์‹ ํ˜ธ๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. ChatDoctor [192]๋Š” ๋„๋ฆฌ ์‚ฌ์šฉ๋˜๋Š” ์˜จ๋ผ์ธ ์˜๋ฃŒ ์ƒ๋‹ด ํ”Œ๋žซํผ์—์„œ ์ˆ˜์ง‘ํ•œ 10๋งŒ ๊ฐœ์˜ ํ™˜์ž-์˜์‚ฌ ๋Œ€ํ™” ๋ฐ์ดํ„ฐ์…‹์„ ์‚ฌ์šฉํ•ด LLaMA๋ฅผ ํŒŒ์ธํŠœ๋‹ํ•˜์—ฌ, ํ™˜์ž์˜ ์š”๊ตฌ๋ฅผ ์ดํ•ดํ•˜๊ณ  ํšจ๊ณผ์ ์ธ ๊ถŒ์žฅ ์‚ฌํ•ญ์„ ์ œ๊ณตํ•˜๋Š” ๋Šฅ๋ ฅ์„ ํฌ๊ฒŒ ๊ฐ•ํ™”ํ–ˆ์Šต๋‹ˆ๋‹ค. FinGPT [193]๋Š” ๊ธˆ์œต ๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์˜คํ”ˆ์†Œ์Šค LLM์„ ๊ฐœ๋ฐœํ–ˆ์œผ๋ฉฐ, ์ž๋™ ๋ฐ์ดํ„ฐ ํ๋ ˆ์ด์…˜๊ณผ ๊ฒฝ๋Ÿ‰ํ™”๋œ ์ €๋žญํฌ ์ ์‘ ๊ธฐ๋ฒ•์„ ํ™œ์šฉํ•˜์—ฌ ํŒŒ์ธํŠœ๋‹ํ–ˆ์Šต๋‹ˆ๋‹ค. DISC-LawLLM [194]์€ ์ค‘๊ตญ ์‚ฌ๋ฒ• ๋„๋ฉ”์ธ์„ ์œ„ํ•œ ์ง€๋„ ํ•™์Šต ํŒŒ์ธํŠœ๋‹ ๋ฐ์ดํ„ฐ์…‹์„ ๊ตฌ์ถ•ํ•˜์—ฌ, ๋‹ค์–‘ํ•œ ๋ฒ•๋ฅ  ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ ์‚ฌ์šฉ์ž๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ์ง€์›ํ•  ์ˆ˜ ์žˆ๋„๋ก LLM์„ ํŒŒ์ธํŠœ๋‹ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ๊ณผ์ •์—์„œ ๋ฒ•๋ฅ  ์ถ”๋ก  ๋Šฅ๋ ฅ์ด ํฌ๊ฒŒ ํ–ฅ์ƒ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด์™€ ๊ฐ™์€ ์—ฐ๊ตฌ๋“ค์€ LLM์ด ํŠน์ • ๋„๋ฉ”์ธ์˜ ์š”๊ตฌ์‚ฌํ•ญ์— ๋งž์ถฐ ๊ณ ๊ธ‰ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๊ฐ–์ถ”๋„๋ก ํ•˜๋Š” ๋ฐ ์ค‘์š”ํ•œ ๊ธฐ์—ฌ๋ฅผ ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

7. Conclusion

์ด ๋…ผ๋ฌธ์—์„œ๋Š” ์งˆ์˜์˜ ์ฃผ์š” ์ดˆ์ ์„ ๊ธฐ์ค€์œผ๋กœ ๋ฐ์ดํ„ฐ ์ฆ๊ฐ• LLM ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ๋„ค ๊ฐ€์ง€ ๋ฒ”์ฃผ๋กœ ๊ตฌ๋ถ„ํ•˜๋ฉฐ, ๊ฐ ๋ฒ”์ฃผ๋Š” ๊ณ ์œ ํ•œ ๋„์ „ ๊ณผ์ œ์— ์ง๋ฉดํ•˜๊ณ  ์žˆ์–ด ์ด์— ๋งž๋Š” ๋งž์ถคํ˜• ์†”๋ฃจ์…˜์ด ํ•„์š”ํ•จ์„ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค. Figure 05์— ์ด๋ฅผ ๋‚˜ํƒ€๋‚ด์—ˆ์Šต๋‹ˆ๋‹ค. ์ •์  ์ƒ์‹ ์ง€์‹์— ๊ด€๋ จ๋œ ์งˆ์˜ : ์ผ๋ฐ˜์ ์ธ LLM์„ Chain of Thought(CoT) ๋ฐฉ๋ฒ•๋ก ์„ ํ†ตํ•ด ๋ฐฐ์น˜ํ•˜๋Š” ๊ฒƒ์ด ํšจ๊ณผ์ ์ž…๋‹ˆ๋‹ค. ๋ช…์‹œ์  ์‚ฌ์‹ค ์งˆ์˜ : ์ฃผ์š” ๋„์ „ ๊ณผ์ œ๋Š” ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ๋‚ด์—์„œ ์ •ํ™•ํ•œ ์‚ฌ์‹ค์˜ ์œ„์น˜๋ฅผ ์ฐพ์•„๋‚ด๋Š” ๊ฒƒ์ด๋ฉฐ, ์ด์— ๋”ฐ๋ผ ๊ธฐ๋ณธ์ ์ธ RAG(Retrieval-Augmented Generation)๊ฐ€ ์ตœ์ ์˜ ๋ฐฉ๋ฒ•์œผ๋กœ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. ์•”์‹œ์  ์‚ฌ์‹ค ์งˆ์˜ : ๋‹ค์ˆ˜์˜ ๊ด€๋ จ๋œ ์‚ฌ์‹ค์„ ์ข…ํ•ฉํ•ด์•ผ ํ•˜๋Š” ์ด ์œ ํ˜•์˜ ์งˆ์˜์—์„œ๋Š” ๋ฐ˜๋ณต์ ์ธ RAG ๋ฐ ๊ทธ๋ž˜ํ”„๋‚˜ ํŠธ๋ฆฌ ๊ตฌ์กฐ์— ๊ธฐ๋ฐ˜ํ•œ RAG ๊ตฌํ˜„์ด ์„ ํ˜ธ๋ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฐฉ์‹์€ ๊ฐœ๋ณ„ ์‚ฌ์‹ค์„ ๊ฒ€์ƒ‰ํ•˜๊ณ  ๋‹ค์ˆ˜์˜ ๋ฐ์ดํ„ฐ ํฌ์ธํŠธ๋ฅผ ์ƒํ˜ธ ์—ฐ๊ฒฐํ•˜๋Š” ๋Šฅ๋ ฅ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ, ๋ฐฉ๋Œ€ํ•œ ๋ฐ์ดํ„ฐ ์—ฐ๊ฒฐ์ด ํ•„์š”ํ•œ ๊ฒฝ์šฐ text-to-SQL ๊ธฐ์ˆ ์„ ํ™œ์šฉํ•˜์—ฌ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ๋„๊ตฌ๋ฅผ ํ†ตํ•ด ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๋ฅผ ๊ฒ€์ƒ‰ํ•˜๋Š” ๊ฒƒ์ด ํ•„์ˆ˜์ ์ž…๋‹ˆ๋‹ค. ํ•ด์„ ๊ฐ€๋Šฅํ•œ ๋…ผ๊ฑฐ ์งˆ์˜ : ์™ธ๋ถ€ ์ง€์นจ์— ๋Œ€ํ•œ LLM์˜ ์ค€์ˆ˜ ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๊ธฐ ์œ„ํ•ด ํ”„๋กฌํ”„ํŠธ ํŠœ๋‹(prompt tuning) ๋ฐ CoT ํ”„๋กฌํ”„ํŒ…์ด ์ค‘์š”ํ•œ ์—ญํ• ์„ ํ•ฉ๋‹ˆ๋‹ค. ์ˆจ๊ฒจ์ง„ ๋…ผ๊ฑฐ ์งˆ์˜ : ๊ฐ€์žฅ ์–ด๋ ค์šด ์œ ํ˜•์œผ๋กœ, ๋ฐฉ๋Œ€ํ•œ ๋ฐ์ดํ„ฐ ์„ธํŠธ์—์„œ ๋ฌธ์ œ ํ•ด๊ฒฐ ์ ‘๊ทผ ๋ฐฉ์‹์„ ์ž์œจ์ ์œผ๋กœ ์ข…ํ•ฉํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ด ๊ฒฝ์šฐ ์˜คํ”„๋ผ์ธ ํ•™์Šต, ์ธ์ปจํ…์ŠคํŠธ ํ•™์Šต, ํŒŒ์ธํŠœ๋‹์ด ํ•ต์‹ฌ ๋ฐฉ๋ฒ•๋ก ์œผ๋กœ ํ™œ์šฉ๋ฉ๋‹ˆ๋‹ค.

ํŠน์ • LLM ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ๊ฐœ๋ฐœํ•˜๊ธฐ ์ „์—, ๋„๋ฉ”์ธ ์ „๋ฌธ๊ฐ€๋กœ์„œ ์šฐ๋ฆฌ๋Š” ๋ชฉํ‘œ ์ž‘์—…์— ๋Œ€ํ•œ ๊นŠ์€ ์ดํ•ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์งˆ์˜์˜ ๋ณต์žก์„ฑ ์ˆ˜์ค€์„ ํŒŒ์•…ํ•˜๊ณ , ์ ํ•ฉํ•œ ๊ธฐ์ˆ ์  ์ ‘๊ทผ๋ฒ•์„ ์„ ํƒํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์ ‘๊ทผ๋ฒ•์€ Figure 06์— ์ œ์‹œ๋œ ์„ธ ๊ฐ€์ง€ ์ฃผ์š” ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ํ†ตํ•ด LLM์— ์ง€์‹์„ ์ฃผ์ž…ํ•ฉ๋‹ˆ๋‹ค: ์งˆ์˜๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋„๋ฉ”์ธ ๋ฐ์ดํ„ฐ์˜ ์ผ๋ถ€๋ฅผ ์ถ”์ถœํ•˜์—ฌ LLM์˜ ์ปจํ…์ŠคํŠธ ์ž…๋ ฅ์œผ๋กœ ์ œ๊ณต, ํŠน์ • ๋„๋ฉ”์ธ ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•ด ์†Œ๊ทœ๋ชจ ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•œ ๋’ค, ์ด๋ฅผ ํ†ตํ•ด ์™ธ๋ถ€ ์ •๋ณด๋ฅผ LLM์— ํ†ตํ•ฉ, ์™ธ๋ถ€ ๋„๋ฉ”์ธ ์ง€์‹์„ ์‚ฌ์šฉํ•ด ์ผ๋ฐ˜์ ์ธ LLM์„ ๋„๋ฉ”์ธ ์ „๋ฌธ ๋ชจ๋ธ๋กœ ํŒŒ์ธํŠœ๋‹ ์ด๋“ค ์ „๋žต์€ ์š”๊ตฌ๋˜๋Š” ๋ฐ์ดํ„ฐ ์–‘, ํ›ˆ๋ จ ์‹œ๊ฐ„, ๊ณ„์‚ฐ ์ž์› ์ธก๋ฉด์—์„œ ๊ฐ๊ฐ ๋‹ค๋ฅธ ์š”๊ตฌ ์‚ฌํ•ญ์„ ๊ฐ€์ง€๋ฉฐ, ๋ณต์žก๋„๊ฐ€ ์ ์ง„์ ์œผ๋กœ ์ฆ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. ์ปจํ…์ŠคํŠธ๋ฅผ ํ†ตํ•œ ์ง€์‹ ์ฃผ์ž… : ์ด ๋ฐฉ๋ฒ•์€ ๋” ๋‚˜์€ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ๊ณผ ์•ˆ์ •์„ฑ์„ ์ œ๊ณตํ•˜์ง€๋งŒ, ์œ ํ•œํ•œ ์ปจํ…์ŠคํŠธ ์œˆ๋„์šฐ์™€ ์ค‘๊ฐ„ ์ •๋ณด ์†์‹ค ๊ฐ€๋Šฅ์„ฑ์œผ๋กœ ์ธํ•ด ํ•œ๊ณ„๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค [40]. ๋”ฐ๋ผ์„œ ์งง์€ ํ…์ŠคํŠธ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ„๊ฒฐํ•˜๊ฒŒ ์„ค๋ช…ํ•  ์ˆ˜ ์žˆ๋Š” ์‹œ๋‚˜๋ฆฌ์˜ค์— ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ด ๋ฐฉ์‹์€ ๋ชจ๋ธ์˜ ๊ฒ€์ƒ‰ ๋Šฅ๋ ฅ๊ณผ ์ง€์‹ ์ถ”์ถœ ๋Šฅ๋ ฅ์— ๋„์ „ ๊ณผ์ œ๋ฅผ ์ œ๊ธฐํ•ฉ๋‹ˆ๋‹ค. ์†Œ๊ทœ๋ชจ ๋ชจ๋ธ ์ ‘๊ทผ๋ฒ• : ์ด ๋ฐฉ์‹์€ ํ›ˆ๋ จ ์‹œ๊ฐ„์„ ์ค„์ด๊ณ  ์ƒ๋‹นํ•œ ์–‘์˜ ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ฉํ•  ์ˆ˜ ์žˆ๋Š” ์žฅ์ ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์†Œ๊ทœ๋ชจ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์— ๋”ฐ๋ผ LLM์˜ ๋ณต์žกํ•œ ์ž‘์—… ์ˆ˜ํ–‰ ๋Šฅ๋ ฅ์ด ์ œํ•œ๋  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๋ฐ์ดํ„ฐ๊ฐ€ ์ฆ๊ฐ€ํ•จ์— ๋”ฐ๋ผ ์ถ”๊ฐ€์ ์ธ ํ›ˆ๋ จ ๋น„์šฉ์ด ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํŒŒ์ธํŠœ๋‹ : ๋ฐฉ๋Œ€ํ•œ ๋„๋ฉ”์ธ ํŠนํ™” ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•ด ๋Œ€ํ˜• ๋ชจ๋ธ์˜ ์—ญ๋Ÿ‰์„ ์ตœ๋Œ€ํ™”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ LLM์˜ ์„ฑ๋Šฅ์— ๋Œ€ํ•œ ํŒŒ์ธํŠœ๋‹์˜ ์˜ํ–ฅ์€ ์‚ฌ์šฉ๋œ ๋ฐ์ดํ„ฐ ์„ค๊ณ„์— ํฌ๊ฒŒ ์˜์กดํ•ฉ๋‹ˆ๋‹ค. ๋„๋ฉ”์ธ ์™ธ๋ถ€์˜ ์‚ฌ์‹ค ๋ฐ์ดํ„ฐ๋ฅผ ํŒŒ์ธํŠœ๋‹์— ์‚ฌ์šฉํ•˜๋ฉด LLM์ด ๋” ๋งŽ์€ ์˜ค๋ฅ˜๋ฅผ ์ƒ์„ฑํ•  ๊ฐ€๋Šฅ์„ฑ์ด ์žˆ์œผ๋ฉฐ, ๊ธฐ์กด์˜ ๋„๋ฉ”์ธ ์ง€์‹์„ ์žƒ๊ฑฐ๋‚˜ ํŒŒ์ธํŠœ๋‹ ๋™์•ˆ ๋‹ค๋ฃจ์ง€ ์•Š์€ ์ž‘์—…์„ ์†Œํ™€ํžˆ ํ•  ์œ„ํ—˜์ด ์žˆ์Šต๋‹ˆ๋‹ค [110, 195].

๋”ฐ๋ผ์„œ, LLM์— ์ ํ•ฉํ•œ ๋ฐ์ดํ„ฐ ์ฃผ์ž… ์ „๋žต์„ ์„ ํƒํ•˜๋ ค๋ฉด ๋ฐ์ดํ„ฐ ์†Œ์Šค์— ๋Œ€ํ•œ ์ฒ ์ €ํ•œ ์ดํ•ด์™€ ์ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์‹ ์ค‘ํ•œ ์˜์‚ฌ๊ฒฐ์ •์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ, ์‹ค์งˆ์ ์ธ ์ƒํ™ฉ์—์„œ๋Š” ๋ฐ์ดํ„ฐ ์ฆ๊ฐ• ๊ธฐ๋ฐ˜ LLM ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์ด ๋‹ค์–‘ํ•œ ์œ ํ˜•์˜ ์งˆ์˜๋ฅผ ํฌํ•จํ•˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์•„, ๊ฐœ๋ฐœ์ž๋Š” ์ด๋Ÿฌํ•œ ๋ณต์žกํ•œ ๋ฌธ์ œ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ์—ฌ๋Ÿฌ ๋ฐฉ๋ฒ•๋ก ์„ ํ†ตํ•ฉํ•œ ๋ผ์šฐํŒ… ํŒŒ์ดํ”„๋ผ์ธ์„ ์„ค๊ณ„ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

Last updated