[2024] Text2SQL is Not Enough : Unifying AI and Database with TAG
2025.01.26
Last updated
2025.01.26
Last updated
Paper Link : https://arxiv.org/pdf/2408.14717
๋ฐ์ดํฐ๋ฒ ์ด์ค๋ฅผ ํตํด ์์ฐ์ด ์ง๋ฌธ์ ์๋ตํ๋ AI ์์คํ ์ ์์ฒญ๋ ๊ฐ์น๋ฅผ ์ฐฝ์ถํ ์ ์ฌ๋ ฅ์ ๊ฐ์ง๊ณ ์์ต๋๋ค. ์ด๋ฌํ ์์คํ ์ ์ฌ์ฉ์๊ฐ ์ธ์ด ๋ชจ๋ธ(LMs)์ ๊ฐ๋ ฅํ ์ถ๋ก ๋ฐ ์ง์ ๋ฅ๋ ฅ์ ๋ฐ์ดํฐ ๊ด๋ฆฌ ์์คํ ์ ํ์ฅ ๊ฐ๋ฅํ ๊ณ์ฐ ๋ฅ๋ ฅ๊ณผ ๊ฒฐํฉํ์ฌ ํ์ฉํ ์ ์๋๋ก ํฉ๋๋ค. ์ด ๊ฒฐํฉ๋ ๋ฅ๋ ฅ์ ์ฌ์ฉ์๊ฐ ๋ง์ถคํ ๋ฐ์ดํฐ ์์ค์ ๋ํด ์์ ๋ก์ด ์์ฐ์ด ์ง๋ฌธ์ ํ ์ ์๋๋ก ์ง์ํฉ๋๋ค. ๊ทธ๋ฌ๋ ๊ธฐ์กด์ ๋ฐฉ๋ฒ๊ณผ ๋ฒค์น๋งํฌ๋ ์ด ํ๊ฒฝ์ ์ถฉ๋ถํ ํ๊ตฌํ์ง ๋ชปํ๊ณ ์์ต๋๋ค. Text2SQL ๋ฐฉ๋ฒ์ ๊ด๊ณ ๋์(Relational Algebra)๋ก ํํํ ์ ์๋ ์์ฐ์ด ์ง๋ฌธ์๋ง ์ด์ ์ ๋ง์ถ๊ณ ์์ผ๋ฉฐ, ์ด๋ ์ค์ ์ฌ์ฉ์๊ฐ ๋ฌป๊ณ ์ ํ๋ ์ง๋ฌธ์ ์์ ๋ถ๋ถ๋ง์ ๋ํ๋ ๋๋ค. ๋ง์ฐฌ๊ฐ์ง๋ก, Retrieval-Augmented Generation (RAG)์ ๋ฐ์ดํฐ๋ฒ ์ด์ค ๋ด ํ๋ ๋๋ ์์์ ๋ฐ์ดํฐ ๋ ์ฝ๋์์ ํฌ์ธํธ ์กฐํ๋ก ๋ต๋ณํ ์ ์๋ ์ ํ๋ ๋ฒ์์ ์ง์์๋ง ์ด์ ์ ๋ง์ถ๊ณ ์์ต๋๋ค. ์ฐ๋ฆฌ๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ฅผ ๋์์ผ๋ก ์์ฐ์ด ์ง๋ฌธ์ ๋ต๋ณํ๊ธฐ ์ํ ํตํฉ์ ์ด๊ณ ๋ฒ์ฉ์ ์ธ ํจ๋ฌ๋ค์์ธ Table-Augmented Generation(TAG)์ ์ ์ํฉ๋๋ค. TAG ๋ชจ๋ธ์ ์ธ์ด ๋ชจ๋ธ(LM)๊ณผ ๋ฐ์ดํฐ๋ฒ ์ด์ค ๊ฐ์ ๋ค์ํ ์ํธ์์ฉ์ ํํํ๋ฉฐ, ์ด์ ์ ํ๊ตฌ๋์ง ์์๋ ์์ญ์ ๋ค๋ฃจ์ด LMs์ ์ธ๊ณ ์ง์๊ณผ ์ถ๋ก ๋ฅ๋ ฅ์ ๋ฐ์ดํฐ์ ํ์ฉํ ์ ์๋ ํฅ๋ฏธ๋ก์ด ์ฐ๊ตฌ ๊ธฐํ๋ฅผ ์ ๊ณตํฉ๋๋ค. ์ฐ๋ฆฌ๋ TAG ๋ฌธ์ ๋ฅผ ์ฐ๊ตฌํ๊ธฐ ์ํ ๋ฒค์น๋งํฌ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ๊ฐ๋ฐํ์ผ๋ฉฐ, ํ์ค ๋ฐฉ๋ฒ์ผ๋ก๋ 20% ๋ฏธ๋ง์ ์ง์๋ง ์ฌ๋ฐ๋ฅด๊ฒ ๋ต๋ณํ ์ ์์์ ๋ฐ๊ฒฌํ์ฌ ์ด ๋ถ์ผ์์ ์ถ๊ฐ ์ฐ๊ตฌ์ ํ์์ฑ์ ํ์ธํ์ต๋๋ค. ๋ฒค์น๋งํฌ์ ๋ํ ์ฝ๋๋ https://github.com/TAG-Research/TAG-Bench์์ ๊ณต๊ฐ๋ฉ๋๋ค.
์ธ์ด ๋ชจ๋ธ์ ์ฌ์ฉ์๊ฐ ๋ฐ์ดํฐ์ ๋ํด ์์ฐ์ด ์ง๋ฌธ์ ํ ์ ์๊ฒ ํจ์ผ๋ก์จ ๋ฐ์ดํฐ ๊ด๋ฆฌ์ ํ์ ์ ์ฝ์ํ๋ฉฐ, ์ด๋ก ์ธํด Text2SQL ๋ฐ Retrieval-Augmented Generation (RAG) ๋ฐฉ๋ฒ์ ๋ํ ๋ง์ ์ฐ๊ตฌ๊ฐ ์ด๋ฃจ์ด์ก์ต๋๋ค. ๊ทธ๋ฌ๋ ์ฐ๋ฆฌ์ ๊ฒฝํ(๋ด๋ถ ์์ ๋ฐ Databricks์ ๊ณ ๊ฐ์ ํฌํจํ)์ผ๋ก๋, ์ฌ์ฉ์๋ค์ ์ง๋ฌธ์ด ์ข ์ข ์ด๋ฌํ ํจ๋ฌ๋ค์์ ํ๊ณ๋ฅผ ๋์ด์๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค. ์ด๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์์คํ ์ ๋ ผ๋ฆฌ์ ์ถ๋ก ๋ฅ๋ ฅ๊ณผ ํ๋ ์ธ์ด ๋ชจ๋ธ(LMs)์ ์์ฐ์ด ์ถ๋ก ๋ฅ๋ ฅ์ ๊ฒฐํฉํ๋ ์์คํ ์ ๋ํ ์๋ก์ด ์ฐ๊ตฌ ํฌ์๊ฐ ํ์ํจ์ ์์ฌํฉ๋๋ค. ํนํ, ์ค์ ๋น์ฆ๋์ค ์ฌ์ฉ์์ ์ง๋ฌธ์ ์ข ์ข ๋๋ฉ์ธ ์ง์, ์ธ๊ณ ์ง์, ์ ํํ ๊ณ์ฐ ๋ฐ ์๋ฏธ์ ์ถ๋ก ์ ์ ๊ตํ ์กฐํฉ์ ์๊ตฌํ๋ค๋ ๊ฒ์ ์๊ฒ ๋์์ต๋๋ค. ๋ฐ์ดํฐ๋ฒ ์ด์ค ์์คํ ์ ์ต์ ๋ฐ์ดํฐ๋ฅผ ์ ์ฅํ์ฌ ๋๋ฉ์ธ ์ง์์ ์ถ์ฒ๋ฅผ ์ ๊ณตํ๊ณ , ๋๊ท๋ชจ๋ก ์ ํํ ๊ณ์ฐ์ ์ํํ ์ ์๊ธฐ ๋๋ฌธ์ (LMs๊ฐ ์ํ์ง ๋ชปํ๋ ๋ถ๋ถ) ์ค์ํ ์ญํ ์ ํฉ๋๋ค. LMs๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ๊ธฐ์กด ๊ธฐ๋ฅ์ ๋ ๊ฐ์ง ์ฃผ์ ๋ฐฉ์์ผ๋ก ํ์ฅํ ์ ์์ต๋๋ค.
์ฒซ์งธ, LMs๋ ํ ์คํธ ๋ฐ์ดํฐ์ ๋ํ ์๋ฏธ์ ์ถ๋ก ๋ฅ๋ ฅ์ ๊ฐ์ง๊ณ ์์ผ๋ฉฐ, ์ด๋ ๋ง์ ์์ฐ์ด ์ฌ์ฉ์ ์ง๋ฌธ์ ํต์ฌ ์์์ ๋๋ค. ์๋ฅผ ๋ค์ด, Databricks ๊ณ ๊ฐ ์ค๋ฌธ์กฐ์ฌ์์๋ ์ฌ์ฉ์๊ฐ "์ ํ X์ ๋ํ ๊ณ ๊ฐ ๋ฆฌ๋ทฐ ์ค ์ด๋ค ๊ฒ์ด ๊ธ์ ์ ์ธ๊ฐ?" ๋๋ "์ ์ด ๊ธฐ๊ฐ ๋์ ๋ด ๋งค์ถ์ด ๋จ์ด์ก์๊น?"์ ๊ฐ์ ์ง๋ฌธ์ ํ๊ณ ์ถ์ด ํ๋ค๊ณ ๋ฐํ์ต๋๋ค. ์ด๋ฌํ ์ง๋ฌธ์ ๊ฐ์ ๋ถ์์ด๋ ํธ๋ ๋ ์์ฝ๊ณผ ๊ฐ์ ๋ณต์กํ ์ถ๋ก ๊ธฐ๋ฐ ์์ ์ ํฌํจํฉ๋๋ค. LMs๋ ์ ํต์ ์ธ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์์คํ ์ ์ ํํ ๊ณ์ฐ์ด๋ ๊ด๊ณํ ์ฐ์ฐ์ผ๋ก ๋ชจ๋ธ๋งํ ์ ์๋ ์ด๋ฌํ ์์ ์ ์ ํฉํฉ๋๋ค.
๋์งธ, LM์ ๋ชจ๋ธ ํ๋ จ ์ค์ ํ์ตํ ์ง์๊ณผ ๋ชจ๋ธ์ ๊ฐ์ค์น์ ์๋ฌต์ ์ผ๋ก ์ ์ฅ๋ ์ง์์ ์ฌ์ฉํ์ฌ ์ฌ์ฉ์์ ๋ฐ์ดํฐ๋ฅผ ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ํ ์ด๋ธ ์คํค๋ง์ ๋ช ์์ ์ผ๋ก ์บก์ฒ๋์ง ์์ ์ธ๊ณ ์ง์์ผ๋ก ๊ฐ๋ ฅํ๊ฒ ๋ณด๊ฐํ ์ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, Databricks์ ๋ด๋ถ AI ์ฌ์ฉ์๋ "์๋งค(retail) ๋ถ์ผ์ QoQ ํธ๋ ๋๋ ๋ฌด์์ธ๊ฐ?"๋ผ๋ ์ง๋ฌธ์ ๊ณ์ ์ด๋ฆ, ์ ํ ๋ฐ ์์ต์ ๋ํ ์์ฑ์ ํฌํจํ๋ ํ ์ด๋ธ์ ๋ณด๊ณ ๋ฌป์์ต๋๋ค. ์ด ์ง๋ฌธ์ ๋ตํ๊ธฐ ์ํด ์์คํ ์ ๋น์ฆ๋์ค๊ฐ QoQ๋ฅผ ์ด๋ป๊ฒ ์ ์ํ๋์ง(์: ๋ง์ง๋ง ๋ถ๊ธฐ์์ ํ์ฌ ๋ถ๊ธฐ๊น์ง์ ๋ถ๊ธฐ๋ณ ํธ๋ ๋ ๋๋ ์๋ ์ด ๋ถ๊ธฐ์์ ์ฌํด ์ด ๋ถ๊ธฐ๊น์ง์ ํธ๋ ๋)์ ์ด๋ค ํ์ฌ๋ค์ด ์๋งค ๋ถ์ผ์ ์ํ๋์ง๋ฅผ ์ดํดํด์ผ ํฉ๋๋ค. ์ด ์์ ์ ์ฌ์ ํ๋ จ๋๊ฑฐ๋ ์ธ๋ถ ์กฐ์ ๋ LM์ด ๊ฐ์ง ์ง์์ ํ์ฉํ๊ธฐ์ ์ ํฉํฉ๋๋ค.
๋ฐ์ดํฐ๋ฒ ์ด์ค์ LMs๋ฅผ ํจ์จ์ ์ผ๋ก ๊ฒฐํฉํ์ฌ ์์ฐ์ด ์ง์์ ์๋ตํ๋ ์์คํ ์ ๊ทธ ์ ๋ฐ์ ์ธ ๋ฒ์์์ ์ฌ์ฉ์๋ค์ด ๋ฐ์ดํฐ๋ฅผ ์ดํดํ๋ ๋ฐฉ์์ ํ์ ํ ์ ์ฌ๋ ฅ์ ๊ฐ์ง๊ณ ์์ต๋๋ค. ๋ถํํ๋, ํ์ฌ ์ด๋ฌํ ์ง๋ฌธ๋ค์ Text2SQL์ด๋ RAG์ ๊ฐ์ ์ผ๋ฐ์ ์ธ ๋ฐฉ๋ฒ์ผ๋ก๋ ๋ตํ ์ ์์ต๋๋ค. Text2SQL ๋ฐฉ๋ฒ์ ์ง์ ์ ์ธ ๊ด๊ณํ ๋์์ด ์๋ ์์ฐ์ด ์ง์์ ์ผ๋ถ์๋ ์ ํฉํ์ง๋ง, ์๋ฏธ์ ์ถ๋ก ์ด๋ ์ธ๊ณ ์ง์์ด ํ์ํ ๊ด๋ฒ์ํ ์ฌ์ฉ์ ์ง์๋ฅผ ์ฒ๋ฆฌํ ์ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, ์ด์ ์ ์ ์๋ "์ด๋ค ๊ณ ๊ฐ ๋ฆฌ๋ทฐ๊ฐ ๊ธ์ ์ ์ธ๊ฐ?"๋ผ๋ ์ง๋ฌธ์ ๊ฐ ๋ฆฌ๋ทฐ๋ฅผ ๊ธ์ ์ ๋๋ ๋ถ์ ์ ์ผ๋ก ๋ถ๋ฅํ๊ธฐ ์ํด ๋ฆฌ๋ทฐ์ ๋ํ ๋ ผ๋ฆฌ์ ํ ๋จ์ LM ์ถ๋ก ์ด ํ์ํ ์ ์์ต๋๋ค. ๋ง์ฐฌ๊ฐ์ง๋ก, "์ ๋งค์ถ์ด ๋จ์ด์ก๋๊ฐ?"๋ผ๋ ์ง๋ฌธ์ ์ฌ๋ฌ ํ ์ด๋ธ ํญ๋ชฉ์ ๊ฑธ์ณ ์ ๋ณด๋ฅผ ์ง๊ณํด์ผ ํ๋ ์ถ๋ก ์ง๋ฌธ์ ํฌํจํฉ๋๋ค.
๋ฐ๋ฉด, RAG ๋ชจ๋ธ์ ๋ช ๊ฐ์ ๋ฐ์ดํฐ ๋ ์ฝ๋์ ๋ํ ๋จ์ํ ๊ด๋ จ์ฑ ๊ธฐ๋ฐ ํฌ์ธํธ ์กฐํ์ ๊ทธ ๋ค๋ฅผ ๋ฐ๋ฅด๋ ํ ๋ฒ์ LM ํธ์ถ๋ก ์ ํ๋ฉ๋๋ค. ์ด ๋ชจ๋ธ์ ํฌ์ธํธ ์กฐํ๋ก ๋ตํ ์ ์๋ ์ง์์ ํ์ ์งํฉ๋ง ์ฒ๋ฆฌํ ์ ์์ผ๋ฉฐ, ๋ง์ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์์คํ ์ ํ๋ถํ ์ง์ ์คํ ๋ฅ๋ ฅ์ ํ์ฉํ์ง ๋ชปํฉ๋๋ค. ์ด๋ก ์ธํด ๊ณ์ฐ ์์ (์: ์นด์ดํ , ์ํ ๋ฐ ํํฐ๋ง)์ ์ค๋ฅ๊ฐ ๋ฐ์ํ๊ธฐ ์ฌ์ด LM์ ํ ๋ฒ ํธ์ถํ๋ ๊ฒ์ผ๋ก ์ฒ๋ฆฌ๋ฉ๋๋ค. ๊ณ์ฐ ์์ ์์ ์ค๋ฅ๊ฐ ๋ฐ์ํ๊ธฐ ์ฝ๊ณ ๋นํจ์จ์ ์ผ ๋ฟ๋ง ์๋๋ผ, LM์ ๊ธด ๋งฅ๋ฝ์ ํ๋กฌํํธ์์ ์ฑ๋ฅ์ด ๋จ์ด์ง๋ ๊ฒ์ผ๋ก ๋ํ๋ฌ์ผ๋ฉฐ, ์ด๋ RAG์ ์์ฑ ๋จ๊ณ์์ ๋ฐ์ดํฐ๋ฅผ ๋๊ท๋ชจ๋ก ์ถ๋ก ํ๋ ๋ฅ๋ ฅ์ ์ ํํฉ๋๋ค.
์ฐ๋ฆฌ๋ ๋์ ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ๋ํ ์์ฐ์ด ์ง๋ฌธ์ ๋ตํ๋ ์์คํ ์ ์ํ ํตํฉ๋ ํจ๋ฌ๋ค์์ผ๋ก ํ ์ด๋ธ ๋ณด๊ฐ ์์ฑ(table-augmented generation, TAG)์ ์ ์ํฉ๋๋ค. ๊ตฌ์ฒด์ ์ผ๋ก, TAG๋ Figure 1์ ํ์๋ ์ธ ๊ฐ์ง ์ฃผ์ ๋จ๊ณ๋ฅผ ์ ์ํฉ๋๋ค. ์ฒซ์งธ, ์ง์ ํฉ์ฑ ๋จ๊ณ์ธ syn์ ์ฌ์ฉ์์ ์์์ ์์ฐ์ด ์์ฒญ ์ ์คํ ๊ฐ๋ฅํ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์ง์ ๋ก ๋ณํํฉ๋๋ค. ๊ทธ๋ค์, ์ง์ ์คํ ๋จ๊ณ์ธ exec์ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์์คํ ์์ ๋ฅผ ์คํํ์ฌ ๊ด๋ จ ๋ฐ์ดํฐ๋ฅผ ํจ์จ์ ์ผ๋ก ๊ณ์ฐํ ๋ฅผ ์ป์ต๋๋ค. ๋ง์ง๋ง์ผ๋ก, ๋ต๋ณ ์์ฑ ๋จ๊ณ์ธ gen์ ๊ณผ ๋ฅผ ํ์ฉํ์ฌ LM์ด ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ฐ๋ณต์ ์ด๊ฑฐ๋ ์ฌ๊ท์ ์ธ ๋ฐฉ์์ผ๋ก ์กฐ์ ๋์ด ์ต์ข ์์ฐ์ด ๋ต๋ณ ๋ฅผ ์์ฑํฉ๋๋ค. TAG ๋ชจ๋ธ์ ๊ฐ๋จํ์ง๋ง ๊ฐ๋ ฅํฉ๋๋ค. ๋ค์ ์ธ ๊ฐ์ง ๋ฐฉ์ ์์ผ๋ก ์ ์๋๋ฉฐ, LMs์ ๋ฐ์ดํฐ๋ฒ ์ด์ค ๊ฐ์ ์ด์ ์ ์ถฉ๋ถํ ์ฐ๊ตฌ๋์ง ์์๋ ๋ค์ํ ์ํธ์์ฉ์ ํฌ์ฐฉํฉ๋๋ค.
Query Synthesis : syn() โ ........... (1)
Query Execution : exec() โ ........... (2)
Answer Generation : gen() โ ........... (3)
ํนํ, TAG ๋ชจ๋ธ์ ์ด์ ์ ๋ฐฉ๋ฒ๋ค์ธ Text2SQL๊ณผ RAG๋ฅผ ํตํฉํฉ๋๋ค. ์ด ๋ ๋ฐฉ๋ฒ์ TAG์ ํน์ํ ๊ฒฝ์ฐ์ ํด๋นํ๋ฉฐ, ์ ํ๋ ์ฌ์ฉ์ ์ง๋ฌธ์ ํ์ ์งํฉ๋ง ์ฒ๋ฆฌํฉ๋๋ค.
์ฌ๋ฌ ์ด์ ์ฐ๊ตฌ๋ค์ด TAG์ ํน์ํ ๊ฒฝ์ฐ๋ฅผ ๋ค๋ฃจ์์ง๋ง, ์ฐ๋ฆฌ๋ LM ์ถ๋ก ๋ฐ ์ง์ ๋ฅ๋ ฅ์ ์๊ตฌํ๋ ํ์ค์ ์ธ ์ง์๋ฅผ ํญ๋๊ฒ ํฌํจํ ์ฒซ ๋ฒ์งธ ์๋ ํฌ ์๋(TAG) ๋ฒค์น๋งํฌ๋ฅผ ์ ๊ณตํฉ๋๋ค. ์ฐ๋ฆฌ๋ ์ด๋ฌํ ์ ํ์ ์ง๋ฌธ์ด ์ ์ํ๋ ์ค์ํ ์ฐ๊ตฌ์ ๋์ ๊ณผ ํจ์จ์ ์ธ TAG ๊ตฌํ์ ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ค๋๋ค. ์ฐ๋ฆฌ์ ํ๊ฐ์์๋ ๊ธฐ๋ณธ์ ์ธ Text2SQL๊ณผ RAG ๋ฒค์น๋งํฌ๋ฅผ ๋น๋กฏํ์ฌ, LM ์์ฑ์ ๊ฒฐํฉํ Text2SQL๊ณผ LM ๊ธฐ๋ฐ ์ฌ์์ํ๋ฅผ ํ์ฉํ ๊ฒ์ ๋ฐฉ๋ฒ์ ํฌํจํ ๋ ๊ฐ์ง ๋ ๊ฐ๋ ฅํ ๋ฒค์น๋งํฌ๋ฅผ ๋ถ์ํฉ๋๋ค. ๋ค์ํ ์ง์ ์ ํ์์ ๊ฐ ๋ฒค์น๋งํฌ ๋ฐฉ๋ฒ์ด ์ผ๊ด๋๊ฒ ๋์ ์ ํ๋๋ฅผ ๋ฌ์ฑํ์ง ๋ชปํ๊ณ , ์ ํํ ์ผ์น์จ์ด 20%๋ฅผ ๋์ง ์์์ ๋ฐ๊ฒฌํ์ต๋๋ค. ๋ฐ๋ฉด, ์ฐ๋ฆฌ๋ ์ต์ LOTUS ๋ฐํ์ ์์ ์๋์ผ๋ก ์์ฑํ TAG ํ์ดํ๋ผ์ธ์ ๊ตฌํํ์ฌ ๋ฒค์น๋งํฌ์ ๋นํด ์ต๋ 20-65% ๋ ๋์ ์ ํ๋๋ฅผ ๋ฌ์ฑํ์ต๋๋ค. ์ด ์ฑ๋ฅ ๊ฒฉ์ฐจ๋ ํจ์จ์ ์ธ TAG ์์คํ ๊ตฌ์ถ์ ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ค๋๋ค.
์ด์ ์ฐ๋ฆฌ๋ TAG ๋ชจ๋ธ์ ๋ํด ์ค๋ช ํฉ๋๋ค. TAG ๋ชจ๋ธ์ ์์ฐ์ด ์์ฒญ ๐ ์ ๋ฐ์ ๋ฐ์ดํฐ ์์ค๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์์ฐ์ด ๋ต๋ณ ๐ด๋ฅผ ๋ฐํํฉ๋๋ค. TAG ์์คํ ์ด ๊ตฌํํ๋ ์ธ ๊ฐ์ง ์ฃผ์ ๋จ๊ณ๋ฅผ ์ค๋ช ํฉ๋๋ค: ์ง์ ํฉ์ฑ, ์ง์ ์คํ, ๊ทธ๋ฆฌ๊ณ ๋ต๋ณ ์์ฑ์ ๋๋ค. ์ฐ๋ฆฌ๋ TAG๋ฅผ ์ด๋ฌํ ๋จ๊ณ๋ฅผ ํ ๋ฒ ์ํํ๋ ๋ฐฉ์์ผ๋ก ์ ์ํ์ง๋ง, TAG๋ฅผ ๋ค์ค ํ(multi-hop) ๋ฐฉ์์ผ๋ก ํ์ฅํ ์๋ ์์ต๋๋ค.
syn ํจ์๋ ์์ฐ์ด ์์ฒญ ๐ ์ ๋ฐ์ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์์คํ ์์ ์คํํ ์ง์ ๐๋ฅผ ์์ฑํฉ๋๋ค. ์ฌ์ฉ์ ์์ฒญ์ด ์ฃผ์ด์ง๋ฉด, ์ด ๋จ๊ณ๋ (a) ์์ฒญ์ ๋ตํ๊ธฐ ์ํด ์ด๋ค ๋ฐ์ดํฐ๊ฐ ๊ด๋ จ์ด ์๋์ง ์ถ๋ก ํ๋ ์์ (์: ํ ์ด๋ธ ์คํค๋ง๋ฅผ ์ฌ์ฉ)๊ณผ (b) ์ฌ์ฉ์ ์์ฒญ์ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์์คํ ์์ ์คํํ ์ ์๋ ์ง์๋ก ๋ณํํ๊ธฐ ์ํด ์๋ฏธ๋ก ์ ํ์ฑ์ ์ํํ๋ ์์ ์ ๋ด๋นํฉ๋๋ค. ์ด ์ง์๋ ์ด๋ค ์ง์ ์ธ์ด๋ก๋ ๋ ์ ์์ง๋ง, ์ฐ๋ฆฌ ์์์์๋ SQL์ ์ฌ์ฉํฉ๋๋ค. Figure 1์ "๊ฐ์ฅ ๋์ ์์ต์ ์ฌ๋ฆฐ ๋ก๋งจ์ค ์ํ ์ค '๊ณ ์ '์ผ๋ก ๊ฐ์ฃผ๋๋ ์ํ์ ๋ฆฌ๋ทฐ๋ฅผ ์์ฝํ๋ผ"๋ ์ฌ์ฉ์ ์ง์๋ฅผ ์ํ TAG ๊ตฌํ ์์๋ฅผ ๋ณด์ฌ์ค๋๋ค. ์ฌ๊ธฐ์ ๋ฐ์ดํฐ ์์ค๋ ๊ฐ ์ํ์ ์ ๋ชฉ, ์์ต, ์ฅ๋ฅด, ๊ทธ๋ฆฌ๊ณ ๊ด๋ จ๋ ๋ฆฌ๋ทฐ์ ๋ํ ์ ๋ณด๋ฅผ ํฌํจํ๊ณ ์์ต๋๋ค. ์ด ๋จ๊ณ์์ ์์คํ ์ LM์ ์๋ฏธ์ ์ถ๋ก ๋ฅ๋ ฅ์ ํ์ฉํ์ฌ ์ํ ์ ๋ชฉ, ๋ฆฌ๋ทฐ, ์์ต, ์ฅ๋ฅด ์์ฑ์ ์ฌ์ฉํ๋ SQL ์ง์๋ฅผ ์์ฑํฉ๋๋ค. ์ด ์์์์๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค API๊ฐ SQL ์ง์ ๋ด์์ LM UDF๋ฅผ ์คํํ ์ ์์ผ๋ฏ๋ก, ์ด ๋จ๊ณ๋ ์ฟผ๋ฆฌ ๋ด์์ ๊ณ ์ ์ํ๋ฅผ ์๋ณํ๊ธฐ ์ํด ๊ฐ ํ์ ๋ํด LM์ ํธ์ถํ๋ ์์ ๋ ํฌํจํฉ๋๋ค.
์ง์ ์คํ ๋จ๊ณ์์ exec ํจ์๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์์คํ ์์ ์ง์ ๐๋ฅผ ์คํํ์ฌ ํ ์ด๋ธ ๐๋ฅผ ์ป์ต๋๋ค. ์ด ๋จ๊ณ๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์ง์ ์์ง์ ํ์ฉํ์ฌ ๋ฐฉ๋ํ ์์ ์ ์ฅ๋ ๋ฐ์ดํฐ์ ๋ํด ํจ์จ์ ์ผ๋ก ์ง์๋ฅผ ์คํํฉ๋๋ค.
๋ฐ์ดํฐ๋ฒ ์ด์ค API๋ ๋ค์ํ ์์คํ ์์ ์ ๊ณต๋ ์ ์์ผ๋ฉฐ, ์ฐ๋ฆฌ๋ ์ด๋ฅผ 3์ฅ์์ ๋ค๋ฃน๋๋ค. ์ผ๋ถ API๋ LM ๊ธฐ๋ฐ ์ฐ์ฐ์๋ฅผ ํ์ฉํ ์ ์์ผ๋ฉฐ, ์ด๋ฅผ ํตํด ๋ฐ์ดํฐ๋ฒ ์ด์ค ์์ง์ด exec ๋ด์์ LM์ ์ธ๊ณ ์ง์๊ณผ ์ถ๋ก ๋ฅ๋ ฅ์ ํ์ฉํ ์ ์์ต๋๋ค.
Figure 1์์ ๋ณด์ฌ์ฃผ๋ ์์์์๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์ง์๊ฐ SQL๋ก ์์ฑ๋ ์ ํ ๋ฐ ์์ ์ง์์ด๋ฉฐ, ๊ด๋ จ๋ ํ์ ํฌํจํ๋ ํ ์ด๋ธ์ ๋ฐํํฉ๋๋ค. ์ด ์ง์๋ LM์ ์ฌ์ฉํ์ฌ ์ํ ์ ๋ชฉ์ ๋ฐ๋ผ ์ด๋ค ์ํ๊ฐ ๊ณ ์ ์ํ์ธ์ง๋ฅผ ํ๊ฐํ๊ณ , ์ฅ๋ฅด ํํฐ๋ฅผ ์ฌ์ฉํ์ฌ ๋ก๋งจ์ค ์ํ๋ฅผ ์ฐพ์ต๋๋ค. ๋ํ, ์์ต์ ๊ธฐ์ค์ผ๋ก ๊ฒฐ๊ณผ๋ฅผ ์์ ๋งค๊ฒจ ๊ฐ์ฅ ๋์ ์์ต์ ์ฌ๋ฆฐ ์ํ๋ฅผ ์ฐพ์ต๋๋ค. ๊ทธ๋ฆผ์์ ๋ณด๋ฏ์ด, ๊ฒฐ๊ณผ ํ ์ด๋ธ์๋ ์ํ "ํ์ดํ๋"์ ๋ํ ๋ฆฌ๋ทฐ๊ฐ ํฌํจ๋์ด ์์ต๋๋ค.
TAG์ ๋ต๋ณ ์์ฑ ๋จ๊ณ๋ RAG์ ์์ฑ ๋จ๊ณ๋ฅผ ๋ฐ์ํฉ๋๋ค. ์ด ๋จ๊ณ์์๋ gen function์ด ๊ณ์ฐ๋ ๋ฐ์ดํฐ ๋ฅผ ์ฌ์ฉํ์ฌ ์ฌ์ฉ์์ ์์ฐ์ด ์์ฒญ ์ ๋ํ ๋ต๋ณ ๋ฅผ ์ธ์ด ๋ชจ๋ธ(LM)์ ํตํด ์์ฑํฉ๋๋ค.
Figure 1์ ์์ TAG ํ์ดํ๋ผ์ธ์ ์ต์ข ๋จ๊ณ๋ฅผ ๋ณด์ฌ์ฃผ๋ฉฐ, ์ฌ์ฉ์์ ์๋ ์์ฒญ์ ๋ํ ๋ต๋ณ์ผ๋ก "ํ์ดํ๋" ๋ฆฌ๋ทฐ ์์ฝ์ ์ถ๋ ฅํฉ๋๋ค. ์ด ์์์์ ๊ด๋ จ ๋ฐ์ดํฐ ๋ ๋ชจ๋ธ์ด ์ฒ๋ฆฌํ ์ ์๋๋ก ๋ฌธ์์ด๋ก ์ธ์ฝ๋ฉ๋ฉ๋๋ค. ์ธ์ฝ๋ฉ๋ ํ ์ด๋ธ์ ์๋ ์ฌ์ฉ์ ์์ฒญ ๊ณผ ํจ๊ป ์ธ์ด ๋ชจ๋ธ(LM)์ ์ ๋ฌ๋ฉ๋๋ค. ์ด ๋จ๊ณ์์๋ ๋ฆฌ๋ทฐ ์ด์ ์์ฝํ๊ธฐ ์ํด ๋ชจ๋ธ์ ์๋ฏธ์ ์ถ๋ก ๋ฅ๋ ฅ์ ํ์ฉํ์ฌ ๋ต๋ณ์ ์์ฑํฉ๋๋ค.
์ด ์น์ ์์๋ TAG ๋ชจ๋ธ์ ๋ฒ์ฉ์ฑ์ ํ๊ตฌํ๊ณ , ์ด๋ฅผ ํตํด ์์ฑ๋๋ ํ๋ถํ ์ค๊ณ ๊ณต๊ฐ์ ์ค๋ช ํ๋ฉฐ, ์ถ๊ฐ ์ฐ๊ตฌ๋ฅผ ์ํ ๋ช ๊ฐ์ง ์ถฉ๋ถํ ์ฐ๊ตฌ๋์ง ์์ ๊ธฐํ๋ฅผ ๊ฐ์กฐํฉ๋๋ค.
Query Types TAG ๋ชจ๋ธ์ ๋ค์ํ ์์ฐ์ด ์ฌ์ฉ์ ์ง์์ ๋์ํ ๋งํผ ํํ๋ ฅ์ด ์ถฉ๋ถํฉ๋๋ค. ์ฐ๋ฆฌ๋ ์ง์๋ฅผ ๋ ๊ฐ์ง ์ค์ํ ๊ธฐ์ค์ผ๋ก ๋ถ๋ฅํด ์ดํด๋ด ๋๋ค: (a) ์ง์์ ๋ตํ๊ธฐ ์ํด ํ์ํ ๋ฐ์ดํฐ ์ง๊ณ ์์ค(=level of data aggregatin)๊ณผ (b) ์ง์์ ๋ตํ๋ ๋ฐ ํ์ํ ์ง์ ๋ฐ ๊ธฐ๋ฅ(=knowledge and capabiltiy)์ ๋๋ค. ๋จผ์ , TAG ๋ชจ๋ธ์ ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ํ๋ ๊ฐ์ ํ์ ์กฐํํ๋ ๊ฒ์ ๊ธฐ๋ฐ ์ง๋ฌธ๊ณผ ๊ฐ์ ๋จ์ผ ์ง์๋ฟ๋ง ์๋๋ผ, ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ์ฌ๋ฌ ํ์ ๋ ผ๋ฆฌ์ ์ผ๋ก ๋ถ์ํด์ผ ํ๋ ์์ฝ ๋๋ ์์ ๊ธฐ๋ฐ ์ง๋ฌธ๊ณผ ๊ฐ์ ์ง๊ณ ์ง์๋ ์ฒ๋ฆฌํ ์ ์์ต๋๋ค. ๋์งธ, TAG ๋ชจ๋ธ์ ์์คํ ์ด ๋ฐ์ดํฐ ์ ๊ณต์ด๋ ์ถ๋ก ๊ธฐ๋ฐ ๊ธฐ๋ฅ์ ์๊ตฌํ๋ ๋ค์ํ ์์ฐ์ด ์ง์๋ ์ฒ๋ฆฌํ ์ ์์ต๋๋ค. ์ฌ๊ธฐ์๋ ๊ฐ์ ๋ถ์์ด๋ ๋ถ๋ฅ์ ๊ฐ์ ์์ ์ด ํฌํจ๋ฉ๋๋ค.
Data Model ๊ธฐ๋ณธ ๋ฐ์ดํฐ ๋ชจ๋ธ์ ๋ค์ํ ํํ๋ฅผ ์ทจํ ์ ์์ต๋๋ค. ์ฐ๋ฆฌ์ ๊ตฌํ์์๋ ๊ด๊ณํ ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ฅผ ์ฌ์ฉํ์ฌ ๊ตฌ์กฐํ๋ ์์ฑ์ ์ ์ฅํ๊ณ ๊ฒ์ํ๋ฉฐ, ์ด๋ฅผ ํ์ ์ง๋ฌธ-์๋ต ์์ ์์ ์ง์ ๊ธฐ๋ฐ์ผ๋ก ํ์ฉํฉ๋๋ค. ๋ค๋ฅธ ๊ตฌํ์์๋ ๋ณด๋ค ๋น๊ตฌ์กฐ์ ์ธ ๋ฐ์ดํฐ(์: ์์ ํ ์คํธ, ์ด๋ฏธ์ง, ๋์์, ์ค๋์ค)๋ ๋ฐ๊ตฌ์กฐํ๋ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ ์๋ ์์ผ๋ฉฐ, ์ด๋ฌํ ๋ฐ์ดํฐ๋ ํค-๊ฐ, ๊ทธ๋ํ, ๋ฒกํฐ, ๋ฌธ์, ๊ฐ์ฒด ์ ์ฅ์ ๋ฑ ๋ค์ํ ๋ฐ์ดํฐ ๋ชจ๋ธ๋ก ์ ์ฅ๋ ์ ์์ต๋๋ค.
Database Execution Engine and API ๋ฐ์ดํฐ๋ฅผ ์ ์ฅํ๋ ๋ฐ ์ฌ์ฉ๋๋ ๊ธฐ๋ณธ ์์คํ ์ ๋ค์ํ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์คํ ์์ง์ ์ฌ์ฉํ ์ ์์ต๋๋ค. Text2SQL์ ์ฌ์ฉ์์ ์ง์์ ๋ํด ๊ด๊ณํ ๋ฐ์ดํฐ๋ฅผ ๊ฒ์ํ๊ธฐ ์ํด SQL ๊ธฐ๋ฐ ์ฟผ๋ฆฌ ์์ง์ ์ฌ์ฉํ๋ ํ๊ฒฝ์ ๋ค๋ฃน๋๋ค. ์ด ํ๊ฒฝ์์ syn์ ํ ์ด๋ธ ์คํค๋ง์ ๊ฐ์ ๋ฐ์ดํฐ ์์ค์ ๋ํ ์ง์์ ํ์ฉํ์ฌ ๊ฒ์ ๋จ๊ณ๋ฅผ ์ํํ๊ธฐ ์ํ SQL ์ฟผ๋ฆฌ๋ฅผ ๋ฐํํฉ๋๋ค. ๋ ๋ค๋ฅธ ์ผ๋ฐ์ ์ธ ํ๊ฒฝ์์๋ ๋ฒกํฐ ์๋ฒ ๋ฉ ๊ธฐ๋ฐ ๊ฒ์ ์์คํ ์ด ์ฌ์ฉ๋๋ฉฐ, ์ด ๊ฒฝ์ฐ syn์ ์์ฐ์ด ์ง์๋ฅผ ์๋ฒ ๋ฉ์ผ๋ก ๋ณํํ๊ณ exec๋ ๋ฒกํฐ ์ ์ฅ์์์ ์ ์ฌ๋ ๊ธฐ๋ฐ ๊ฒ์์ ์ํํฉ๋๋ค.
์์ ๋๊ฐ์ง ํ๊ฒฝ์ด ๋๋ฆฌ ์ฐ๊ตฌ๋์์ง๋ง, ์ถฉ๋ถํ ์ฐ๊ตฌ๋์ง ์์ ๋ช ๊ฐ์ง ๋์์ ํ๊ฒฝ์ ๋ ๋์ ๋ฒ์์ ์ง์๋ฅผ ์ฒ๋ฆฌํ๊ธฐ ์ํด TAG ์์คํ ์ ํจ์จ์ ์ผ๋ก ๊ตฌํํ ์ ์๋ ํฅ๋ฏธ๋ก์ด ๊ธฐํ๋ฅผ ์ ๊ณตํฉ๋๋ค. ์๋ฅผ ๋ค์ด, ์ต๊ทผ ์ฐ๊ตฌ๋ค์ ๊ด๊ณํ ๋ชจ๋ธ์ ์๋ฏธ์ ์ฐ์ฐ์(semantic operators)๋ฅผ ์ถ๊ฐํ๊ณ ์์ต๋๋ค. ์ด๋ ์ ์ธ์ AI ๊ธฐ๋ฐ ์ฐ์ฐ์ (์: ํํฐ๋ง, ์ ๋ ฌ, ์ง๊ณ, ์์ฐ์ด ์ง์ ์๋ฅผ ์ฌ์ฉํ ๊ฒ์)๋ LM ์ฌ์ฉ์ ์ ์ ํจ์์ ๊ฐ์ ๋ฒ์ฉ LM ํจ์ ์งํฉ์ ์ ๊ณตํฉ๋๋ค. ๋ํ MADLib, Google์ BigQuery ML, Microsoft์ Predictive SQL๊ณผ ๊ฐ์ ์ฟผ๋ฆฌ ์ธ์ด๋ SQL ๊ธฐ๋ฐ API์ ๋จธ์ ๋ฌ๋(Machine Learning) ๊ธฐ๋ฐ ํจ์๋ค์ ๊ธฐ๋ณธ์ ์ผ๋ก ํตํฉํ์ฌ ํ์ฅํ๊ณ ์์ต๋๋ค. ์ด๋ฌํ ์์คํ ์ ํ์ฉํ๋ฉด ์ต์ ํ๋ ์ถ๋ก ๊ธฐ๋ฐ ๊ฒ์ ํจํด์ ์คํํ ์ ์๋ ๋ ํนํ ๊ธฐํ๋ฅผ ์ ๊ณตํฉ๋๋ค. ์๋ฅผ ๋ค์ด, Figure 1์ ์ ์๋ ์์์์, ์๋ฏธ์ ์ฐ์ฐ์(semantic operators)๋ฅผ ํ์ฉํ์ฌ ๊ตฌํ๋ TAG ํ์ดํ๋ผ์ธ์ ์ฟผ๋ฆฌ ์คํ ๋จ๊ณ์์ sem_filter ์ฐ์ฐ์๋ฅผ ์ฌ์ฉํด ํด๋น ํ์ด '๊ณ ์ (classic)'์ธ์ง ์ฌ๋ถ์ ๋ฐ๋ผ ํ์ ํํฐ๋งํ ์ ์์ต๋๋ค.
LM Generation Patterns ๊ด๋ จ ๋ฐ์ดํฐ ํ ์ด๋ธ ๊ฐ ์ฃผ์ด์ง๋ฉด, gen์ ์ฌ์ฉ์์ ์์ฒญ ์ ๋ํ ์ต์ข ์์ฐ์ด ๋ต๋ณ ๋ฅผ ์์ฑํ๊ธฐ ์ํด ๋ค์ํ ๊ตฌํ ์ ํ์ผ๋ก ๊ตฌ์ฑ๋ ์ ์์ต๋๋ค. Text2SQL์ ์ต์ข ์์ฑ ๋จ๊ณ๋ฅผ ์๋ตํ๊ณ ์ฟผ๋ฆฌ ์คํ์์ ๋ฉ์ถ๋ ๋ฐ๋ฉด, RAG ํ์ดํ๋ผ์ธ์ ์ผ๋ฐ์ ์ผ๋ก ๊ด๋ จ ๋ฐ์ดํฐ๋ฅผ ๋ฌธ๋งฅ์ ํฌํจ์์ผ ๋จ์ผ ์ธ์ด ๋ชจ๋ธ(LM) ํธ์ถ์ ํตํด ๋ต๋ณ์ ์์ฑํฉ๋๋ค. ์ด ํ๊ฒฝ์์ ํ ์ด๋ธ ์ธ์ฝ๋ฉ, ํ๋กฌํํธ ์์ถ, ํ๋กฌํํธ ํ๋๊ณผ ๊ด๋ จ๋ ํ์ ๋ฌธ์ ๋ฅผ ์ฐ๊ตฌํ์ฌ ๋ฌธ๋งฅ ํ์ต ๊ฒฐ๊ณผ๋ฅผ ์ต์ ํํ๋ ค๋ ์ฌ๋ฌ ์ฐ๊ตฌ๊ฐ ์ด๋ฃจ์ด์ง๊ณ ์์ต๋๋ค.
์ต๊ทผ ์ฐ๊ตฌ์ธ LOTUS์ ๋ค์์ ๋ฐ์ดํฐ ํ์ ๊ฑธ์น ์ถ๋ก ๊ธฐ๋ฐ ๋ณํ, ์ง๊ณ, ๋๋ ์์ ๋งค๊ธฐ๊ธฐ๊ฐ ํ์ํ ์ง์์ ๋ตํ๊ธฐ ์ํด ๋ฐ๋ณต์ (iterative) ๋๋ ์ฌ๊ท์ (recursive) LM ์์ฑ ํจํด์ ๊ตฌ์ฑํ๋ ์ ์ฌ๋ ฅ์ ๊ฐ์กฐํฉ๋๋ค. ์ด๊ธฐ ์ฐ๊ตฌ๋ค์ ์ด๋ฌํ LM ๊ธฐ๋ฐ ์๊ณ ๋ฆฌ์ฆ์ด ์ ๊ณตํ๋ ํ๋ถํ ์ค๊ณ ๊ฐ๋ฅ์ฑ๊ณผ ์ฌ๋ฌ ๋ค์ด์คํธ๋ฆผ ์์ ์์์ ์ ๋งํ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ฌ์ฃผ๊ณ ์์ต๋๋ค.
์ด ์น์ ์์๋ ์ฒซ ๋ฒ์งธ TAG ๋ฒค์น๋งํฌ๋ฅผ ์๊ฐํ๊ณ , ๋ค์ ์ง๋ฌธ๋ค์ ๋ค๋ฃจ๊ธฐ ์ํด ์ฌ๋ฌ ๊ธฐ์ค ๋ชจ๋ธ์ ํ๊ฐํฉ๋๋ค:
How do existing methods for table question answering perform on queries requiring semantic reasoning or world knowledge?
How does a hand-written implementation of the TAG model, which divides computational and reasoning steps across DBMS and LM operations, perform on these queries?
๊ธฐ์กด ๋ฒค์น๋งํฌ๋ ๋ชจ๋ธ์ด ๋ฐ์ดํฐ ์์ค์ ์๋ ๋ฐ์ดํฐ๋ง์ผ๋ก ์ ์ ์ผ๋ก ๋ตํ ์ ์๋ ๊ธฐ๋ณธ์ ์ธ ์ง์์์ ์ด๋ป๊ฒ ์ฑ๋ฅ์ ๋ฐํํ๋์ง์ ๋ํด ํ๊ตฌํ์ต๋๋ค. ์ฐ๋ฆฌ๋ ์ด์ ์ฐ๊ตฌ๋ฅผ ๋ฐํ์ผ๋ก ์ง์๋ฅผ ์์ ํ์ฌ ๋ฐ์ดํฐ ์์ค์์ ์ง์ ์ ์ผ๋ก ์ฌ์ฉํ ์ ์๋ ์ง์์ด๋ ์๋ฏธ์ ์ถ๋ก ์ ํ์๋ก ํ๋ ๋ฐฉ์์ผ๋ก ํ์ฅํ์ต๋๋ค. ์ฐ๋ฆฌ๋ LMs๊ฐ ํ๊ฐ๋ ๋๋ฆฌ ์ฌ์ฉ๋๋ Text2SQL ๋ฒค์น๋งํฌ์ธ BIRD๋ฅผ ์ ํํ์ต๋๋ค. BIRD๋ ๋๊ท๋ชจ ํ ์ด๋ธ๊ณผ ๋ค์ํ ๋๋ฉ์ธ ๋ฐ ์ง์ ์ ํ์ ์ ๊ณตํ๊ธฐ ๋๋ฌธ์ ๋๋ค.
Dataset ์ฐ๋ฆฌ์ ์ง์๋ BIRD์์ ์ ํํ 5๊ฐ์ ๋๋ฉ์ธ์ ํฌํจํ๋ฉฐ, ๊ฐ ๋๋ฉ์ธ์ ์ง์ ์ ํ์์ ๋ค์์ฑ์ ์ ๊ณตํฉ๋๋ค. ์ฐ๋ฆฌ๋ california_schools, debit_card_specializing, formula_1, codebase_community, european_football_2๋ฅผ ์ง์์ ์ฌ์ฉํ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์์ค๋ก ์ ํํ์ต๋๋ค.
Queries BIRD ๋ฒค์น๋งํฌ๋ ๋งค์น ๊ธฐ๋ฐ, ๋น๊ต, ์์ ๋งค๊ธฐ๊ธฐ, ์ง๊ณ ์ง์ ๋ฑ ๊ธฐ๋ณธ์ ์ธ ์ง์ ์ ํ์ ์ ์ํฉ๋๋ค. ์ฐ๋ฆฌ๋ ์ด๋ค ์ ํ ์ค์์ ์ง์๋ฅผ ์ ํํ๊ณ , ๋ชจ๋ธ์ด ๋ต๋ณํ๊ธฐ ์ํด ์ธ๊ณ ์ง์์ด๋ ์๋ฏธ์ ์ถ๋ก ์ด ํ์ํ๋๋ก ์์ ํฉ๋๋ค. ์๋ฅผ ๋ค์ด, ์ธ๊ณ ์ง์์ด ํ์ํ ์์ ๋ ์ง์๋ก๋ california_schools DB์์ Bay Area์ ์๋ ํ๊ต๋ง์ ์์ฒญํ๋ ์ถ๊ฐ์ ์ธ ์กฐ๊ฑด์ ํฌํจํ๋ ์ง์๊ฐ ์์ต๋๋ค. ์ด ์ ๋ณด๋ ํ ์ด๋ธ์ ์์ผ๋ฉฐ, ๋ชจ๋ธ์ ์ธ๊ณ ์ง์์ด ํ์ํฉ๋๋ค. ๋ค์์ผ๋ก, LM ์ถ๋ก ์ด ํ์ํ ์์ ๋ ์ง์๋ codebase_community DB์์ ํน์ ๊ฒ์๋ฌผ์ ๋ํ ๊ฐ์ฅ ๋น์ ๋๋ ๋๊ธ 3๊ฐ๋ฅผ ์์ฒญํ๋ ์ง์์ ๋๋ค. ์ด๋ฌํ ์ง์์ ๋ํ ํ๊ฐ๋ ์ฌ๋์ ์ํด ๋ ์ด๋ธ์ด ๋ฌ๋ฆฐ ์ง์ค ๋ฐ์ดํฐ๋ฅผ ๊ธฐ์ค์ผ๋ก ํฉ๋๋ค. ์ฐ๋ฆฌ์ ์ต์ข ๋ฒค์น๋งํฌ๋ 80๊ฐ์ ์์ ๋ ์ง์๋ก ๊ตฌ์ฑ๋๋ฉฐ, ๊ทธ ์ค 40๊ฐ๋ parametric knowledge๋ฅผ ์๊ตฌํ๊ณ 40๊ฐ๋ ์ถ๋ก ์ ์๊ตฌํฉ๋๋ค. ๋ํ, ๊ฐ 4๊ฐ์ง ์ ํ๋ BIRD ์ง์ ์ ํ์์ 20๊ฐ์ฉ ํฌํจ๋ฉ๋๋ค.
Evaluation Metric ์ฐ๋ฆฌ๋ ๋งค์น ๊ธฐ๋ฐ, ๋น๊ต, ์์ ๋งค๊ธฐ๊ธฐ ์ง์ ์ ํ์ ๋ํด ์ ํ๋๋ฅผ ๋ ์ด๋ธ์ด ์ง์ ๋ ์ ๋ต๊ณผ์ ์ ํํ ์ผ์น ๋น์จ๋ก ์ธก์ ํฉ๋๋ค. ์ง๊ณ ์ง์์ ๊ฒฝ์ฐ, ๊ฐ ๊ธฐ์ค ๋ชจ๋ธ์ ์ฌ์ฉํ ๊ฒฐ๊ณผ์ ๋ํ ์ง์ ๋ถ์์ ์ ๊ณตํฉ๋๋ค. ๋ํ, ๊ฐ ์ง์์ ๋ํ ์คํ ์๊ฐ์ ์ด ๋จ์๋ก ์ธก์ ํฉ๋๋ค.
Experimental Setup ์ฐ๋ฆฌ๋ Meta์ Llama-3.1 ๋ชจ๋ธ์ ์ธ์คํธ๋ญ์ ํ๋ ๋ฒ์ (70B ํ๋ผ๋ฏธํฐ)์ Text2SQL๊ณผ ์ต์ข ์ถ๋ ฅ ์์ฑ์ ์ํ ์ธ์ด ๋ชจ๋ธ(LM)๋ก ์ฌ์ฉํฉ๋๋ค. SQL์ ํฌํจํ ๊ธฐ์ค ๋ชจ๋ธ์๋ SQLite3๋ฅผ ๋ฐ์ดํฐ๋ฒ ์ด์ค API๋ก ์ฌ์ฉํ๊ณ , RAG ๊ธฐ์ค ๋ชจ๋ธ์๋ E5 base ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ์ฌ์ฉํฉ๋๋ค. Llama-3.1-70B-Instruct๋ vLLM์ ์ฌ์ฉํ์ฌ 8๊ฐ์ A100 80GB GPU์์ ์คํ๋ฉ๋๋ค.
Text2SQL ์ด ๊ธฐ์ค ๋ชจ๋ธ์์๋ LM์ด SQL ์ฝ๋๋ฅผ ์์ฑํ๊ณ , ์ด๋ฅผ ์คํํ์ฌ ๋ต๋ณ์ ์ป์ต๋๋ค. ์ฃผ์ด์ง ์์ฐ์ด(NL) ์ง์์ ๋ํด, ์ฐ๋ฆฌ๋ ์ง์์ ๋๋ฉ์ธ์ ์๋ ๋ชจ๋ ํ ์ด๋ธ์ ํ ์ด๋ธ ์คํค๋ง๋ฅผ ํฌํจํ๋ LM ํ๋กฌํํธ๋ฅผ ๊ตฌ์ฑํ๋ฉฐ, ์ด ํ๋กฌํํธ ํ์์ BIRD ์์ ์์ ์ฌ์ฉ๋ ๊ฒ๊ณผ ๋์ผํฉ๋๋ค. ์ฐ๋ฆฌ๋ SQLite3์์ ์์ฑ๋ SQL ์ฝ๋๋ฅผ ์คํํ๊ณ , ์๋ชป๋ ๋ต๋ณ์ ์๋ฅผ ์ธก์ ํ์ฌ ์ด ๊ธฐ์ค ๋ชจ๋ธ์ ํ๊ฐํฉ๋๋ค. ์ฌ๊ธฐ์๋ ๋ชจ๋ธ์ด ์ ํจํ SQL ์ฝ๋๋ฅผ ์์ฑํ์ง ๋ชปํ ๊ฒฝ์ฐ๋ ํฌํจ๋ฉ๋๋ค.
Retriever Augmented Generation (RAG) RAG ์คํ์ผ์ ๋ฐฉ๋ฒ์ ํ ์ด๋ธ ๊ฒ์์ ์ํด ํ๊ตฌ๋ ๋ฐ ์์ต๋๋ค. ์ฌ๊ธฐ์ ํ ํ์์ ๋ฐ์ดํฐ๋ ๊ฒ์์ ์ํด ์ธ๋ฑ์ค์ ์๋ฒ ๋ฉ๋ฉ๋๋ค. ์ฐ๋ฆฌ์ ๊ธฐ์ค ๋ชจ๋ธ์์๋ ํ ์์ค ์๋ฒ ๋ฉ์ ์ฌ์ฉํฉ๋๋ค. ์ฃผ์ด์ง ํ์ ๊ฐ ์ด์ ๋ํด "- col: val" ํ์์ผ๋ก ์ง๋ ฌํ๋ ํ FAISS์ธ๋ฑ์ค์ ์๋ฒ ๋ฉ๋ฉ๋๋ค. ์ง์ ์์๋ ๋ฒกํฐ ์ ์ฌ๋ ๊ฒ์์ ์ํํ์ฌ 10๊ฐ์ ๊ด๋ จ ํ์ ๊ฒ์ํ ํ, ์ด๋ฅผ ์์ฐ์ด ์ง๋ฌธ๊ณผ ํจ๊ป ๋ชจ๋ธ์ ์ ๋ ฅ์ผ๋ก ์ ๊ณตํฉ๋๋ค.
Retriever + LM Rank ์ฐ๋ฆฌ๋ RAG ๊ธฐ์ค ๋ชจ๋ธ์ ํ์ฅํ์ฌ LM์ ํ์ฉํด ๊ฒ์๋ ํ์ ๋ํด 0๊ณผ 1 ์ฌ์ด์ ์ ์๋ฅผ ํ ๋นํ๊ณ , ๋ชจ๋ธ์ ์ ๋ ฅํ๊ธฐ ์ ์ ํ์ ์์๋ฅผ ๋ค์ ๋งค๊น๋๋ค. ์ด๋ STaRK ์์ ์์ ์ํ๋ ๋ฐฉ์๊ณผ ๊ฐ์ต๋๋ค. ์ฐ๋ฆฌ๋ ์์ ์ฌ์กฐ์ ์ ์ํด Llama-3.1-70B-Instruct๋ฅผ ์ฌ์ฉํฉ๋๋ค.
Text2SQL + LM ์ด ๊ธฐ์ค ๋ชจ๋ธ์์๋ ๋จผ์ ๋ชจ๋ธ์ด ์ฃผ์ด์ง ์์ฐ์ด ์ง์ ๋ตํ๊ธฐ ์ํด ๊ด๋ จ ํ ์ธํธ๋ฅผ ๊ฒ์ํ๋ SQL์ ์์ฑํ๋๋ก ์์ฒญํฉ๋๋ค. ์ด๋ Text2SQL ๊ธฐ์ค ๋ชจ๋ธ๊ณผ ์ค์ํ ์ฐจ์ด์ ์ด ์๋๋ฐ, Text2SQL์์๋ ๋ชจ๋ธ์ด ์ง์ SQL ์ฝ๋๋ฅผ ์์ฑํ์ฌ ์คํ ์์ ์ง์์ ๋ํ ๋ต์ ์ ๊ณตํ๋๋ก ์์ฒญ๋ฉ๋๋ค. RAG ๊ธฐ์ค ๋ชจ๋ธ๊ณผ ์ ์ฌํ๊ฒ, ๊ด๋ จ ํ๋ค์ด ๊ฒ์๋ ํ ๋ชจ๋ธ์ ๋ฌธ๋งฅ์ผ๋ก ์ ๋ ฅ๋ฉ๋๋ค.
Hand-written TAG ์ฐ๋ฆฌ๋ ๋ํ ์๋ ์ฟผ๋ฆฌ ์์ฑ ๋์ ํ ์ด๋ธ ์คํค๋ง์ ๋ํ ์ ๋ฌธ๊ฐ ์ง์์ ํ์ฉํ๋ ์์ผ๋ก ์์ฑ๋ TAG ํ์ดํ๋ผ์ธ์ ํ๊ฐํฉ๋๋ค. ์ฐ๋ฆฌ๋ LOTUS๋ฅผ ์ฌ์ฉํ์ฌ ์์ผ๋ก ์์ฑ๋ TAG ํ์ดํ๋ผ์ธ์ ๊ตฌํํฉ๋๋ค. LOTUS API๋ ํ๋ก๊ทธ๋๋จธ๊ฐ ํ์ค ๊ด๊ณํ ์ฐ์ฐ์๋ฟ๋ง ์๋๋ผ LM ๊ธฐ๋ฐ ํํฐ๋ง, ์์ ๋งค๊ธฐ๊ธฐ, ์ง๊ณ์ ๊ฐ์ ์๋ฏธ์ ์ฐ์ฐ์๋ฅผ ์ฌ์ฉํ์ฌ ์ฟผ๋ฆฌ ํ์ดํ๋ผ์ธ์ ์ ์ธ์ ์ผ๋ก ์ง์ ํ ์ ์๊ฒ ํด์ค๋๋ค. LOTUS๋ ๋ํ ์ต์ ํ๋ ์๋ฏธ์ ์ฟผ๋ฆฌ ์คํ ์์ง์ ์ ๊ณตํ๋ฉฐ, ์ด๋ฅผ ์ฌ์ฉํ์ฌ ์์ผ๋ก ์์ฑ๋ TAG ํ์ดํ๋ผ์ธ์ ์ฟผ๋ฆฌ ์คํ๊ณผ ๋ต๋ณ ์์ฑ ๋จ๊ณ๋ฅผ ๊ตฌํํฉ๋๋ค.
Table 1์ ๊ฐ ๋ฐฉ๋ฒ์ ์ ํ๋(exact match : EM)์ ์คํ ์๊ฐ(execution time : ET)์ ๋ณด์ฌ์ค๋๋ค. ํ์์ ์ ์ ์๋ฏ์ด, ์ ํ๋ BIRD ์ง์ ์ ํ์ ๋ํด ์์ผ๋ก ์์ฑ๋ TAG ๊ธฐ์ค ๋ชจ๋ธ์ ์ผ๊ด๋๊ฒ 40% ์ด์์ ์ ํ๋๋ฅผ ๋ฌ์ฑํ๋ ๋ฐ๋ฉด, ๋ค๋ฅธ ๋ชจ๋ ๊ธฐ์ค ๋ชจ๋ธ์ 20%๋ฅผ ๋์ง ๋ชปํฉ๋๋ค.
Text2SQL ๊ธฐ์ค ๋ชจ๋ธ์ ๋ชจ๋ ๊ธฐ์ค ๋ชจ๋ธ์์ ์ฑ๋ฅ์ด ์ข์ง ์์ผ๋ฉฐ, ์คํ ์ ํ๋๊ฐ 20%๋ฅผ ๋์ง ์์ต๋๋ค. ํนํ, ์์ ๋งค๊ธฐ๊ธฐ ์ง์์์๋ 10%์ ์ ํ๋๋ง ๊ธฐ๋กํ๋๋ฐ, ์ด๋ ๋ง์ ์์ ๋งค๊ธฐ๊ธฐ ์ง์๊ฐ ํ ์คํธ์ ๋ํ ์ถ๋ก ์ ์๊ตฌํ๊ธฐ ๋๋ฌธ์ ๋๋ค. Text2SQL + LM ์์ฑ ๊ธฐ์ค ๋ชจ๋ธ์ ๋น์ทํ๊ฒ ์ ๋ฐ์ ์ผ๋ก ์ฑ๋ฅ์ด ์ข์ง ์์ง๋ง, ๋งค์น ๊ธฐ๋ฐ ์ง์์ ๋น๊ต ์ง์์์๋ 10%์ ์ ํ๋๋ง ๊ธฐ๋กํ๋ฉฐ ๋ ๋์ ์ฑ๊ณผ๋ฅผ ๋ณด์ ๋๋ค. ์ด๋ฌํ ์ง์ ์ ํ์์๋ ์คํ๋ SQL ํ์ ๋ง์ ํ์ ๋ชจ๋ธ์ ์ ๋ ฅํ๋ ค๋ค ๋ณด๋ ์ฌ๋ฌ ๊ฐ์ง ๋ฌธ๋งฅ ๊ธธ์ด ์ค๋ฅ๊ฐ ๋ฐ์ํฉ๋๋ค.
RAG ๊ธฐ์ค ๋ชจ๋ธ์ ์ฃผ๋ชฉํ๋ฉด, ๋ชจ๋ ์ง์ ์ ํ์์ ๋จ ํ๋์ ์ง์๋ ์ ํํ๊ฒ ๋ตํ์ง ๋ชปํ๋ ๊ฒ์ ์ ์ ์์ต๋๋ค. ์ด๋ ์ด ์์ญ์์ RAG ๋ชจ๋ธ์ด ์ง์์ ์ ๋ง์ง ์์์ ๊ฐ์กฐํฉ๋๋ค. LM ์์ ์ฌ์กฐ์ ์ ์ถ๊ฐํ๋ฉด Retrieval + LM ์์ ๋ชจ๋ธ์ด ๋น๊ต ์ง์์์ ์ ํํ๊ฒ ๋ตํ ์ ์์ง๋ง, ์ฌ์ ํ RAG๋ฅผ ์ ์ธํ ๋ค๋ฅธ ๋ชจ๋ ๋ชจ๋ธ๋ณด๋ค ์ฑ๋ฅ์ด ๋จ์ด์ง๋๋ค.
์ฐ๋ฆฌ์ Hand-written TAG ๊ธฐ์ค ๋ชจ๋ธ์ ์ ์ฒด์ ์ผ๋ก 55%์ ์ ํ๋๋ก ์ง์์ ๋ตํ๋ฉฐ, ๋น๊ต ์ง์์์๋ ์ ํํ ์ผ์น ์ ํ๋๊ฐ 65%๋ก ๊ฐ์ฅ ๋์ ์ฑ๊ณผ๋ฅผ ๋ณด์ ๋๋ค. ์ด ๊ธฐ์ค ๋ชจ๋ธ์ ์์ ๋งค๊ธฐ๊ธฐ ์ง์๋ฅผ ์ ์ธํ ๋ชจ๋ ์ง์ ์ ํ์์ 50% ์ด์์ ์ ํ๋๋ฅผ ์ผ๊ด๋๊ฒ ๊ธฐ๋กํ๋๋ฐ, ์ด๋ ํญ๋ชฉ์ ์ ํํ๊ฒ ์์๋๋ก ๋์ดํ๋ ๋ฐ ๋ ๋์ ๋์ด๋๊ฐ ์๊ธฐ ๋๋ฌธ์ ๋๋ค. ์ ์ฒด์ ์ผ๋ก ์ด ๋ฐฉ๋ฒ์ ํ์ค ๊ธฐ์ค ๋ชจ๋ธ์ ๋นํด 20%์์ 65%์ ์ ํ๋ ํฅ์์ ์ ๊ณตํฉ๋๋ค.
๋ํ, Table 2๋ ์น์ 3์์ ๋ ผ์๋ ์ง์ ์ ํ์ ๋ํ ํ์ค ๋ฐฉ๋ฒ๋ค์ ์ฝ์ ์ ๊ฐ์กฐํฉ๋๋ค. ํนํ, ๊ธฐ๋ณธ Text2SQL์ ๋ต๋ณ ์์ฑ ๋จ๊ณ๋ฅผ ์๋ตํ๊ธฐ ๋๋ฌธ์ LM ์ถ๋ก ์ด ํ์ํ ์ง์์์ ์ ํํ ์ผ์น ์ ํ๋๊ฐ 10%๋ก ๋งค์ฐ ๋ฎ์ต๋๋ค. ํํธ, RAG ๊ธฐ์ค ๋ชจ๋ธ๊ณผ Retrieval + LM Rank ๊ธฐ์ค ๋ชจ๋ธ์ ๋ชจ๋ ์ง์ ์ ํ์์ ์ฑ๋ฅ์ด ์ข์ง ์์ผ๋ฉฐ, ๋จ ํ๋์ ์ง์๋ง ์ ํํ๊ฒ ๋ตํฉ๋๋ค. ์ด๋ ๋ฐ์ดํฐ์ ๋ํ ์ ํํ ๊ณ์ฐ์ ์ฒ๋ฆฌํ๋ ๋ฐ LM์ ์์กดํ๊ธฐ ๋๋ฌธ์ ๋๋ค. ์ด์ ๋ฐํด, ์์ผ๋ก ์์ฑ๋ TAG ๊ธฐ์ค ๋ชจ๋ธ์ ์ง์์ด ํ์ํ ์ง์์ ์ถ๋ก ์ด ํ์ํ ์ง์ ๋ชจ๋์์ 50% ์ด์์ ์ ํ๋๋ฅผ ๋ฌ์ฑํ๋ฉฐ, TAG ๋ชจ๋ธ์ด ๋ค๋ฃฐ ์ ์๋ ์ง์์ ๋ค์์ฑ์ ๊ฐ์กฐํฉ๋๋ค.
ํนํ, Hand-written TAG ๋ฐฉ๋ฒ์ ๋ฐ์ด๋ ์ ํ๋๋ฟ๋ง ์๋๋ผ ๋ค๋ฅธ ๊ธฐ์ค ๋ชจ๋ธ๋ค์ ๋นํด ์ต๋ 3.1๋ฐฐ ๋ ๋ฎ์ ์คํ ์๊ฐ์ผ๋ก ํจ์จ์ ์ธ ๊ตฌํ์ ์ ๊ณตํฉ๋๋ค. hand-written base model์ ๋ชจ๋ ์ง์์ ๋ํด ํ๊ท 2.94์ด๊ฐ ์์๋ฉ๋๋ค. ์ด ์๋์ ์ผ๋ก ๋ฎ์ ์คํ ์๊ฐ์ ํจ์จ์ ์ธ ๋ฐฐ์น ์ถ๋ก ์ ํ์ฉํ์ฌ ํจ์จ์ ์ธ TAG ์์คํ ์ ์ค๊ณํ ์ ์์์ ๊ฐ์กฐํฉ๋๋ค.
๋ง์ง๋ง์ผ๋ก, ์ฐ๋ฆฌ๋ ์ง๊ณ ์ง์์ ๋ํ ๊ฐ ๊ธฐ์ค ๋ชจ๋ธ์ ๊ฒฐ๊ณผ๋ฅผ ์ง์ ์ผ๋ก ๋ถ์ํฉ๋๋ค. ๊ทธ๋ฆผ 2๋ "Sepang ๊ตญ์ ์ํท์์ ์ด๋ฆฐ ๊ฒฝ๊ธฐ์ ๋ํ ์ ๋ณด๋ฅผ ์ ๊ณตํ์ธ์."๋ผ๋ ์์ ์ง์์ ๋ํ RAG, Naive TAG, hand-written base TAG์ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ฌ์ค๋๋ค. RAG ๊ธฐ์ค ๋ชจ๋ธ์ ๊ด๋ จ๋ ๋๋ถ๋ถ์ ๊ฒฝ๊ธฐ๊ฐ ๊ฒ์๋์ง ์์ ์ผ๋ถ ๊ฒฝ๊ธฐ์ ๋ํ ์ ๋ณด๋ง ์ ๊ณตํฉ๋๋ค. ๋ฐ๋ฉด, Text2SQL + LM ๊ธฐ์ค ๋ชจ๋ธ์ DBMS์์ ์ด๋ค ์ ๋ณด๋ ํ์ฉํ ์ ์๊ณ , ์ค์ง ํ๋ผ๋ฉํธ๋ฆญ ์ง์์๋ง ์์กดํ์ฌ ์ถ๊ฐ์ ์ธ ๋ถ์์ ์ ๊ณตํ์ง ์์ต๋๋ค. ์์ผ๋ก ์์ฑ๋ ๊ธฐ์ค ๋ชจ๋ธ์ 1999๋ ๋ถํฐ 2017๋ ๊น์ง Sepang ๊ตญ์ ์ํท์์ ์ด๋ฆฐ ๋ชจ๋ ๊ฒฝ๊ธฐ์ ๋ํ ์ฒ ์ ํ ์์ฝ์ ์ ๊ณตํฉ๋๋ค. ์ฐ๋ฆฌ๋ ๋ฒค์น๋งํฌ์์ ์ ๊ณตํ๋ ๋ค๋ฅธ ์ง๊ณ ์ง์์์๋ ๋น์ทํ ๊ฒฝํฅ์ ๊ด์ฐฐํ์ผ๋ฉฐ, ์ด๊ธฐ ๊ฒฐ๊ณผ๋ TAG ์์คํ ์ด ๋ง์ ๋ฐ์ดํฐ๋ฅผ ์ฑ๊ณต์ ์ผ๋ก ์ง๊ณํ์ฌ ์ ์ตํ ๋ต๋ณ์ ์ ๊ณตํ ์ ์๋ ์ ์ฌ๋ ฅ์ ๊ฐ์กฐํฉ๋๋ค. ์ ๋์ ๋ถ์์ ํฅํ ์์ ์ ๋งก๊ธฐ๊ฒ ์ต๋๋ค.
Text2SQL LM์ ์ฌ์ฉํ Text2SQL์ ์ด์ ์ฐ๊ตฌ์์ ๊ด๋ฒ์ํ๊ฒ ํ๊ตฌ๋์์ต๋๋ค. WikiSQL, Spider, BIRD๋ ๋ชจ๋ ๊ต์ฐจ ๋๋ฉ์ธ Text2SQL์ ์ํ ์ธ๊ธฐ ์๋ ๋ฐ์ดํฐ์ ์ ๋๋ค. ์ด ๋ฐ์ดํฐ์ ๋ค์ ์์ฐ์ด ์ง์๋ฅผ SQL๋ก ๋ณํํ๋ ์์ ์ ํ๊ฐํ๋ ๋ง์ ๋๋ฉ์ธ์ ๊ตฌ์กฐํ๋ ๋ฐ์ดํฐ๋ฅผ ํฌํจํ๊ณ ์์ต๋๋ค. ๊ทธ๋ฌ๋ ์ด ๋ฐฉํฅ์ SQL ์์ฑ ์ด์์ ๋ชจ๋ธ ๊ธฐ๋ฅ์ ํ์ฉํ์ง ์์ผ๋ฉฐ, ์ถ๋ก ์ด๋ ์ง์์ด ํ์ํ ์ง์๋ ์ ์ ๋ฐ์ดํฐ ์์ค๋ฅผ ๋๋ ์ง์๋ ๋ฒ์ ๋ฐ์ผ๋ก ๋ก๋๋ค.
Retriever-Augmented-Generation Retrieval-augmented generation (RAG)์ LMs๊ฐ ํ๋ผ๋ฉํธ๋ฆญ ์ง์์ ๋์ด ๋๊ท๋ชจ ํ ์คํธ ์ปฌ๋ ์ ์ ํ์ฉํ ์ ์๊ฒ ํฉ๋๋ค. SQuAD์ HotPotQA๋ ๊ฐ๊ฐ ๋จ์ผ ๋ฌธ์์ ์ฌ๋ฌ ๋ฌธ์ ์ถ์ฒ์์์ ์ง๋ฌธ-์๋ต์ ์ค์ ์ ๋ก๋๋ค. Dense Table Retrieval (DTR) ๋ชจ๋ธ์ RAG๋ฅผ ํ ํ์ ๋ฐ์ดํฐ๋ก ํ์ฅํ์ฌ ์ง์๋ฅผ ์ํ ๊ด๋ จ ์ ๊ณผ ํ์ ๊ฒ์ํ ์ ์๋๋ก ํ ํ์์ ๋ฌธ๋งฅ์ ์๋ฒ ๋ฉํฉ๋๋ค. Join-aware table retrieval๋ ๋ณต์กํ ์กฐ์ธ ํ ์ด๋ธ์ ํฌํจํ๋ ์ง์์์ ์ฑ๋ฅ์ ํฅ์์ํค๊ธฐ ์ํด DTR ๋ชจ๋ธ์ ํ ์ด๋ธ-ํ ์ด๋ธ ์ ์ฌ๋ ์ ์ ํญ๋ชฉ์ ์ถ๊ฐํฉ๋๋ค. ๊ธฐ์กด์ RAG ์์ ๊ณผ ๋ฌ๋ฆฌ, TAG ๋ชจ๋ธ์ ์ง์ ์คํ ๋จ๊ณ์์ LM ๊ธฐ๋ฅ์ ํ์ฉํ๊ณ , ๋๋์ ๋ฐ์ดํฐ์ ๋ํ ์ ํํ ๊ณ์ฐ์ ์ํด DBMS ์ฐ์ฐ์ ํ์ฉํ์ฌ ์ฌ์ฉ์๊ฐ ๋ฐ์ดํฐ์ ๋ํด ์ํํ๋ ๋ ๋์ ๋ฒ์์ ์ง์๋ฅผ ํฌ๊ดํฉ๋๋ค.
NL Queries over Semi-structured Data ์ด์ ์ฐ๊ตฌ์์๋ ๋ฐ๊ตฌ์กฐํ๋ ๋ฐ์ดํฐ ์์ค์์ ํ ์ด๋ธ ์ํฐํฐ์ ๋น๊ตฌ์กฐํ๋ ์ํฐํฐ ํ๋ ๊ฐ์ ๊ด๊ณ ์ ๋ณด๋ฅผ ํ๊ตฌํ์ต๋๋ค. STaRK๋ ๊ตฌ์กฐ์ ๋ฐ ๋น๊ตฌ์กฐ์ ์ ๋ณด๋ฅผ ํฌํจํ๋ ๋ฐ๊ตฌ์กฐํ๋ ์ง์ ๊ธฐ๋ฐ(SKB)์์ ํ ์ด๋ธ ๊ฒ์ ๋ฐฉ๋ฒ๋ก ์ ํ๊ฐํฉ๋๋ค. SUQL์ ํ์ด๋ธ๋ฆฌ๋ ๋ฐ์ดํฐ์ ๋ํ ์ฌ์ฉ์์ ๋น๊ตฌ์กฐํ๋ ๊ตฌ์ฑ ์์๋ฅผ ์ฒ๋ฆฌํ๊ธฐ ์ํด LM์ ์๋ฏธ๋ก ์ ํ์๋ก ์ฌ์ฉํ๋ ๋ํํ ๊ฒ์ ์์ ์ ๋ค๋ฃน๋๋ค. ์ด๋ฌํ ์ฐ๊ตฌ๋ค์ ์ฃผ๋ก ๋ฐ๊ตฌ์กฐํ๋ ๋ฐ์ดํฐ์์ ์์ฐ์ด ๊ฒ์ ์ง์์ ์ค์ ์ ๋๊ณ ์์ง๋ง, ์ฐ๋ฆฌ๋ ๊ฒ์๊ณผ ์กฐํ๋ฅผ ๋์ด์ ๋ ๋ง์ LM ๊ธฐ๋ฅ์ ํ์ฉํ ๋ค์ํ ์ง์๋ฅผ ํ๊ตฌํ๋ ค๊ณ ํฉ๋๋ค.
Agentic Data Assistants ์ต๊ทผ ์ฐ๊ตฌ์์๋ LM ์์ด์ ํธ๋ฅผ ๋ฐ์ดํฐ ์ด์์คํดํธ๋ก ํ์ฉํ๋ ๋ฐฉ๋ฒ์ ํ๊ตฌํ์ต๋๋ค. Spider2-V๋ ์ฝ๋ ์์ฑ ๋ฐ GUI ์ ์ด ์์ ์ ํฌํจํ ๋ฉํฐ๋ชจ๋ฌ ์์ด์ ํธ ์ฑ๋ฅ์ ํ๊ตฌํฉ๋๋ค. ์ฐ๋ฆฌ๋ TAG ๋ชจ๋ธ์ syn, exec, gen ํจ์์ ํ ๋ฒ์ ๋ฐ๋ณต์ผ๋ก ๋ช ํํ๊ฒ ์ ์ํ์ง๋ง, ํฅํ ์ฐ๊ตฌ์์๋ ์ด๋ฅผ ์์ด์ ํธ ๋ฃจํ๋ก ํ์ฅํ๋ ๋ฐฉ๋ฒ์ ํ๊ตฌํ ์ ์์ต๋๋ค.
์ด ์ฐ๊ตฌ์์๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ๋ํ ์์ฐ์ด ์ง๋ฌธ์ ๋ตํ๊ธฐ ์ํ ํตํฉ ๋ชจ๋ธ๋ก์ ํ ์ด๋ธ ์ฆ๊ฐ ์์ฑ(TAG)์ ์ ์ํ์ต๋๋ค. ์ฐ๋ฆฌ๋ ๋ ๊ฐ์ง ์ค์ํ ์ ํ์ ์ง์๋ฅผ ์ฐ๊ตฌํ๊ธฐ ์ํ ๋ฒค์น๋งํฌ๋ฅผ ๊ฐ๋ฐํ์ต๋๋ค: ์ธ๊ณ ์ง์์ ์๊ตฌํ๋ ์ง์์ ์๋ฏธ์ ์ถ๋ก ๋ฅ๋ ฅ์ ์๊ตฌํ๋ ์ง์์ ๋๋ค. ์ฐ๋ฆฌ์ ์ฒด๊ณ์ ์ธ ํ๊ฐ ๊ฒฐ๊ณผ, ๊ธฐ์ค ๋ฐฉ๋ฒ๋ค์ด ์ด๋ฌํ ์์ ์์ ์๋ฏธ ์๋ ์ง์ ์ ์ด๋ฃจ์ง ๋ชปํ๋ค๋ ๊ฒ์ ํ์ธํ์ต๋๋ค. ๊ทธ๋ฌ๋ ์์ผ๋ก ์์ฑ๋ TAG ํ์ดํ๋ผ์ธ์ ์ต๋ 65% ๋ ๋์ ์ ํ๋๋ฅผ ๋ฌ์ฑํ ์ ์์ด, TAG ์์คํ ๊ตฌ์ถ์ ์ํ ์๋นํ ์ฐ๊ตฌ ๊ธฐํ๊ฐ ์กด์ฌํจ์ ๋ณด์ฌ์ค๋๋ค.
์ด ์ฐ๊ตฌ๋ ๊ณผ๊ฑฐ์ Stanford DAWN ํ๋ก์ ํธ์ Berkeley์ Sky Computing Lab์ ์ ํด ํ์๋ค๊ณผ ํ์์๋ค, ํนํ Accenture, AMD, Anyscale, Cisco, Google, IBM, Intel, Meta, Microsoft, Mohamed Bin Zayed University of Artificial Intelligence, NVIDIA, Samsung SDS, SAP, VMware, ๊ทธ๋ฆฌ๊ณ Sloan Fellowship์ ์ง์์ ๋ฐ์์ต๋๋ค. ๋ณธ ์๋ฃ์ ํํ๋ ์๊ฒฌ, ์ฐ๊ตฌ ๊ฒฐ๊ณผ, ๊ฒฐ๋ก ๋๋ ์ถ์ฒ ์ฌํญ์ ์ ์๋ค์ ์๊ฒฌ์ด๋ฉฐ, ํ์์๋ค์ ๊ฒฌํด๋ฅผ ๋ฐ๋์ ๋ฐ์ํ์ง๋ ์์ต๋๋ค.
์ฐ๋ฆฌ ๋ฒค์น๋งํฌ๋ฅผ ์ํ BIRD ์ง์์ ๋ํ ์์ ์ฌํญ์ ์์ธํ ์ค๋ช ํฉ๋๋ค. ๊ฐ ์ง์๋ ๋ต๋ณ์ ์ํด LM ์ง์ ๋๋ ์ถ๋ก ์ด ํ์ํ๋๋ก ์์ ๋์์ต๋๋ค. ์๋์ ์ํ ์ง์๋ฅผ ๋ณด์ฌ๋๋ฆฝ๋๋ค.
์ฐ๋ฆฌ๋ ์ง์ ์์ฑ ๋ฐ ๋ต๋ณ ์์ฑ์ ์ํ ์ง์นจ ์กฐ์ ๋ Llama-3.1 80B ๋ชจ๋ธ์ ์ฌ์ฉ๋ ํ๋กฌํํธ๋ฅผ ์์ฝํฉ๋๋ค.
์ง์ ์์ฑ ๋จ๊ณ, ์ฆ ์ฐ๋ฆฌ์ ๊ฒฝ์ฐ Text2SQL ๋จ๊ณ์์๋ ์๋ BIRD ๋ฒค์น๋งํฌ์ ๋์ผํ ํ ์ด๋ธ ์คํค๋ง ์ธ์ฝ๋ฉ๊ณผ LM ํ๋กฌํํธ๋ฅผ ์ฌ์ฉํฉ๋๋ค. ์ง์ ์์ฑ์ ์ํ ์์ ํ๋กฌํํธ๋ ์๋์ ๊ฐ์ต๋๋ค.
Text2SQL + LM ๋ฐ RAG ๋ฒ ์ด์ค๋ผ์ธ์์๋ ๋ต๋ณ ์์ฑ ๋จ๊ณ์์ LM์ด ์ ๊ณต๋ ํ๋ค์ ๋ฐํ์ผ๋ก ์ฌ์ฉ์ ์ง๋ฌธ์ ๋ตํด์ผ ํฉ๋๋ค. ์ฐ๋ฆฌ๋ ์ง๊ณ ์ฟผ๋ฆฌ์ ๋ํด ๋ณ๋์ ํ๋กฌํํธ๋ฅผ ์ฌ์ฉํ๋ฉฐ, ์ผ์น ๊ธฐ๋ฐ, ๋น๊ต, ์์ ์ฟผ๋ฆฌ๋ ๋์ผํ ํ๋กฌํํธ๋ฅผ ๊ณต์ ํฉ๋๋ค. ๋ ๊ฐ์ง ํ๋กฌํํธ๋ ์๋์ ๋์ ์์ต๋๋ค.
์ฐ๋ฆฌ๋ LOTUS ํจํค์ง๋ฅผ ์ฌ์ฉํ์ฌ ์์ผ๋ก ์์ฑํ TAG ํ์ดํ๋ผ์ธ์ ๊ตฌ์ฑํฉ๋๋ค. ๋ฒค์น๋งํฌ์ ์๋ ๊ฐ ์ฟผ๋ฆฌ์ ๋ํด ๋ฐ์ดํฐํ๋ ์ ๋ณํ ๋ฐ ํํฐ๋ง๊ณผ LOTUS ์๋ฏธ๋ก ์ LM ์ฐ์ฐ์๋ฅผ ํฌํจํ ํ์ดํ๋ผ์ธ์ ํ์ด์ฌ์ผ๋ก ์์ฑํ์ต๋๋ค. ์๋์ ์์ ํ์ดํ๋ผ์ธ์ ๋ณผ ์ ์์ต๋๋ค.