본문 바로가기

업스테이지9

IR RAG 경진대회 후기 - 패스트캠퍼스&업스테이지 AI Lab 1기 1. AbstractGoal of the Competition과학 지식 질의 응답 시스템 구축. LLM의 문제 해결을 위해서 IR을 활용한 RAG로 수행.TimelineApril 08, 2024 - Start DateApril 11, 2024 - First Mentoring (Before Competition)April 15, 2024 - Staring Project DateApril 18, 2024 - Second MentoringApril 23, 2024 - Third MentoringApril 29, 2024 - Final MentoringMay 02,  2024 - Final submission deadlineDescription of the Data과학 상식 문서 4272개 ko_ai2_arc_.. 2024. 5. 7.
NLP 경진대회 후기 - 패스트캠퍼스&업스테이지 AI Lab 1기 1. AbstractGoal of the CompetitionText Summarization 일상대화 요약 경진대회. 주어진 데이터를 활용하여 대화의 요약 생성.TimelineMarch 08, 2024 - Start DateMarch 06, 2024 - Mentoring1 (Before Competition)March 15, 2024 - Mentoring2March 20, 2024 - Mentoring3March 20, 2024 - Final submission deadlineDescription of the Data모든 데이터는 .csv 형식으로 제공되고 있으며, 각각의 데이터 건수는 다음과 같습니다.  dev는 validation 데이터이며, test는 public, hidden-test는 priv.. 2024. 3. 24.
알고리즘 테스트 기초 범위 백준에 나오는 code.plus 문제집과 패스트캠퍼스&업스테이지 AI Lab 1기에서 들은 내용을 합쳐서 정리해보았다. 복잡하거나 어려운 상급의 내용이 아니라 코딩테스트를 위한 기초적인 알고리즘 테스트의 범위를 분류해보았다.  자료 구조스택 (Stack)큐 (Queue)우선순위 큐 (Priority Queue)와 힙 (Heap)디큐 (Dequeue)해시맵 (Hash Map)문자열 (String)   구현/시뮬레이션수학문제를 읽고 그대로 구현  탐욕/그리디/Greedy 알고리즘매 단계마다 최적을 선택하며 최종 해답에 도달하는 과정  동적 계획법 / Dynamic Programming (DP)현재 문제를 여러개의 중복된 하위 문제로 바꿔서 푼다.점화식을 세워서 문제를 푼다.바텀업 방식과 탑다운 방식.탑다운 .. 2024. 3. 6.
자연어처리 (NLP) 기초 자연어처리는 컴퓨터가 자연언어 (한국어, 영어, 일본어 등의 자연적으로 생성된 언어)를 이해하고 분석하고 생성할 수 있도록 만드는 기술이다. 언어학의 하위 분야 중에서 전산언어학 (computational linguistics)에서는 컴퓨터 기술을 적극적으로 활용한다. 기존에는 규칙 기반 혹은 통계 기반에서 분석을 했으나 2010년대부터는 딥러닝을 적극적으로 도입했다. 언어학의 연구 분야들은 여러가지가 있지만 AI 분야에서 주의 깊게 봐야할 분야를 대략적으로 분류하면 다음과 같다. 언어학의 분야 형태를 연구하는 음운론(Phonology), 형태론(Morphology) , 통사론(Syntax) 내용을 연구하는 의미론(Semantics) 언어의 사용을 연구하는 화용론(Pragmatics) 형태론 (Morph.. 2024. 2. 29.
Introduction to Generative Models 이 포스트에서는 여러가지 생성모델의 발전 흐름과 간략한 분류를 정리하고자 한다. 우선 생성 모델, Generative Models의 정의를 알아야 한다. 생성 모델의 정의 영문 위키의 generative model 문서를 보면 다음과 같이 정의한다. a generative model is a model of the conditional probability of the observable X, given a target y a discriminative model is a model of the conditional probability of the target Y, given an observation x 또는 A generative model is a statistical model of the jo.. 2024. 2. 26.
알아두면 좋은 주요 딥러닝 모델들 딥러닝 모델 자체는 굉장히 오래되었다고 하지만 여기서는 자세한 역사보다는 기념비적인 논문이자 CNN 구조를 가진 LeNet5과 ImageNet Large Scale Visual Recognition Challenge (ILSVRC)의 2012년 우승 모델인 AlexNet으로 시작해서 2023년까지의 주목할만한 모델들을 정리해보았다. LLM 모델들은 별도로 다룰 필요가 있다고 생각하여 제외하고 가장 유명한 모델인 ChatGPT의 시작인 GPT만 소개한다. Out-of-Distribution (OOD)과 Generation (Generative Adversarial Network, GAN), Document Image Classification 등 개인적으로 관심이 있거나 다양한 강의를 통해 수집한 자료이므.. 2024. 2. 22.