본문 바로가기

Finance6

FinGPT (2023) 논문 리뷰 FinGPT는 금융을 목적으로한 LLM으로 논문 제목은 FinGPT: Open-Source Financial Large Language Models다. (링크) 저자는 Hongyang Yang, Xiao-Yang Liu, Christina Dan Wang다. BloombergGPT와는 다르게 오픈소스 Financial LLM이다. Main Github: 링크 Data Github: 링크Benchmark Github: 링크RAG Github: 링크 IntroductionFinGPT에는 다음의 컨트리뷰션이 있다. 1. Democritization: FinGPT는 오픈 소스 프레임워크이며 financial data와 FinLLM을 모두 공적으로 공개했다. 2. Data-centric approach:데이.. 2025. 5. 2.
BloombergGPT (2023) 논문 리뷰 BloombergGPT는 금융을 목적으로한 LLM으로 논문 제목은 BloombergGPT: A Large Language Model for Finance다. (링크) 저자는 Shijie Wu, Ozan Irsoy, Steven Lu, Vadim Dabravolski, Mark Dredze, Sebastian Gehrmann, Prabhanjan Kambadur, David Rosenberg, Gideon Mann다. Pre-training 부터 직접 학습시킨 LLM으로 50B를 가진 제법 큰 모델이다.Base 모델로는 Open LLM인 BLOOM (블로그 링크)을 사용했다. Abstract금융 기술 영역에서의 NLP 분야의 사용은 방대하고 복잡하다. Sentiment analysis 부터 name.. 2025. 5. 2.
SEC Fillings를 읽기 위한 회계용어 몇가지 정리 우선 한국의 회계기준은 K-IFRS고 미국은 GAAP이란걸 알아야 한다. 한국은 K-IFRS 이후 이익잉여금처분계산서가 지금도 사용이 되는지 모르겠다. 자본변동표의 일부로 살아 있는지 어떤지 찾아봐야겠다. 아래는 ChatGPT한테 시켜보았는데 하나하나 검색해서 살펴보니 틀린 말은 없어 보인다. 그리고 예전에 회계원리를 수강하면서 배웠던 것들이랑 검색을 통해서 몇가지 용어들을 더 추가했다. 영문 이름한국어설명Balance Sheet대차대조표= 재무상태표특정 시점의 자산, 부채, 자본을 보여주는 재무제표입니다.Income Statement손익계산서일정 기간 동안의 수익, 비용, 순이익 등을 보여주는 보고서입니다.Cash Flow Statement현금흐름표영업, 투자, 재무활동에 따른 현금 유입과 유출을.. 2025. 5. 2.
SEC 미국 공시 관련 정보 모음 Fillings 보고서 유형은 정말 여러가지가 있는데 우선 초심자가 기업을 알기 위해서는 다음 사항들을 보면 되는것 같다. 10-K: 연간 재무보고서10-Q: 분기 재무보고서8-K: 수시 보고서 그외 기업 공개 IPO는 S로 시작한다. SEC 보고서는 데이터베이스인 EDGAR에서 검색해서 찾을 수 있다. Meta의 예시 Meta의 경우 EDGAR에서 검색하면 다음과 같이 결과가 나온다. (링크) Document의 meta-20250331.htm iXBRL에 들어가면 아래와 같은 화면이 나온다. 왼쪽의 Sections 를 눌러 보면 목차를 볼 수 있다. Balance Sheet 대차대조표 Crawling 관련 EDGAR Search Assistant (링크)를 보면.. 2025. 5. 2.
Modern Portfolio Theory Basics Modern Portfolio Theory (MPT) 현대 포트폴리오 이론의 기본을 정리하고자 한다. 여기서 말하는 기본은 역시나 학부나 영문 Wikipedia에서 쉽게 볼 수 있는 항목을 말한다. 구체적으로는 Markowitz Model, CML, Asset Pricing Theory의 CAPM, Fama-French 3 Factor model, 그리고 APT 까지를 다룬다. 전체적으로 영문 Wikipedia에 그림과 설명이 잘 나와있어서 번역한다. Markowitz ModelHarry Markowitz가 1950년대에 만든 포트폴리오 최적화 이론이다.마르코비츠는 다음의 가정 하에서 이론을 전개했다. Assumptions 가정들 1. 포트폴리오의 risk 위험은 return 수익률의 varaiabil.. 2025. 4. 28.
Finance Data and LMs for NLP 금융 자연어 데이터는 어떤것들이 있는지 간략하게 정리해보았다. Data Financial Corpus SEC EDGARSeeking AlphaInvestext ReutersBloombergInvestopedia General CorpusWikipediaC4BookCorpus FPBFiQA-SAAnalystToneFiQA-QAFinSBD19HeadlineFinSBD21onvFinQAFINStockNetCIKM18BigData22FOMCFinQAECTSumFinRED FinGPT의 데이터 FinNLP: 링크 Korean Financial DataBC Card Finance Kor 데이터 (링크)KoFinanceLLM open 데이터 (링크)https://huggingface.co/datasets.. 2025. 1. 15.