본문 바로가기

분류 전체보기32

[Week 13]BoostCamp AI Tech - Day65 7. Linking MRC and Retrival 7.1 ODQA(Open-domain Question Answering)란? ODQA : 지문이 따로 주어지지 않고, 방대한 지식에 기반하여 질의 응답을 함 Ex) Modern search engines: 연관문서 뿐만 아니라 질문의 답을 같이 제공 7.2 ODQA의 역사 (추후 추가 예정) 7.3 Retriever-Reader Approach - Retriever : 데이터베이스에서 관련있는 문서를 검색(search) 함 -> 입력 : 문서셋(Document corpus), 질문(query) -> 출력 : 관련성 높은 문서(document) -> TF-IDF, BM25 : 학습 없음 -> Dense : 학습 있음 - Reader : 검색된 문서에서 질문.. 2021. 5. 1.
[Week 11]BoostCamp AI Tech - Day54 (추후 추가 예정) 2021. 4. 17.
[Week 11]BoostCamp AI Tech - Day55 1. KLUE(Korean Language Understanding Evaluation, KLUE) : 한국어 자연어 이해 벤치마크 자연어 task를 하다보면, 다음과 같은 작업을 직면하게 된다. 문장 분류, 관계 추출, 문장 유사도, 자연어 추론, 개체명 인식, 품사 태깅 질의 응답, 목적형 대화, 의존 구문 분석 등... 2. 의존 구문 분석 단어들 사이의 관계를 분석하는 task 2.1 특징 - 지배소 : 의미의 중심이 되는 요소 - 의존소 : 지배소가 갖는 의미를 보완해주는 요소 - 어순과 생략이 자유로운 한국어와 같은 언어에서 주로 연구된다. 2.2 분류 규칙 - 지배소는 후위언어이다. 즉, 지배소는 항상 의존소보다 위에 위치한다. - 각 의존소의 지배소는 하나이다. - 교차 의존 구조는 없다... 2021. 4. 17.
[Week 10]BoostCamp AI Tech - Day46 오늘의 강의 : 데이터 시각화(Data Visualization) 학습 목표 : 데이터 시각화에 대해 알아보고 실습을 하는 것 (부 목표 : 모델 학습 및 추론까지 구현) 다행히, 데이터 시각화와 실습까지 완강을 했으나. 사실, 본인은 파이썬이 좀 어려워서 제출을 하지 못했었다. 그런데, 초반부터 쉽지 않아보였다... 샘플 제출의 정확성이 7%대인데, 모델 학습 및 추론 후에는 9.2... 별로 오르지 않았다;; 내일은 ensemble을 시도하는 것이 목표이고, 그 외에도 좀 더 고민할 예정이다. (글쎄... 할 수 있을까?) 2021. 4. 5.