Dataset
다양한 종류의 데이터셋에 대한 소개와 이를 수집하는 방식을 알아봅니다!
Last updated
다양한 종류의 데이터셋에 대한 소개와 이를 수집하는 방식을 알아봅니다!
Last updated
하나의 완전한 데이터셋을 소개합니다.
AwesomeKorean Data
KorQuad : 한국어 Machine Reading Comprehension 데이터셋
CounselGPT : 한국어 심리 상담 데이터셋
Welfare-QA : 한국어 복지제도 관련 QA 데이터셋
KLUE
Korpora
국립국어원 사전
한국어 챗봇데이터
Korean HateSpeech Data
Ko-Wiki-Data
Kor-Wiki-Hop
Korean Human Judgement
Ko-Calibration
주어진 문서에서 내용을 추출하거나 외부에서 데이터를 수집/크롤링하는 레퍼런스를 소개합니다.
MegaParse
FireCrawl
Playwright
MinerU
PDFMathTranslate
OpenParse : Easy PDF Chunking open-source library
Airflow
Prefect