본문 바로가기

전체 글

[이론 공부] NLP 성능평가 Metric : 2. ROUGE(Recall-Oriented Understudy for Gisting Evaluation) 2. ROUGE(Recall-Oriented Understudy for Gisting Evaluation)저번 BLEU와 같이 Quality평가 지표 중 Supervised - Word based 의 특징을 가지는 ROUGE를 탐구해보고자 합니다. BLEU는 주로 기계번역, 자동요약 task에 활용되는 평가지표입니다. (특히 요약)Supervised라는 의미는, 사람이 번역한 문장을 답으로 제시하여, 기계번역(예측문장) - 사람번역(정답문장) 문장의 유사도를 측정하는 방법입니다.Word based라는 의미는, ROUGE가 연속된 단어 뭉치를 활용하는 n-gram 일치도를 기반으로 유사도를 측정하기 때문입니다. ROUGE의 값은 0 ~ 1 사이에 있고, 1에 가까울 수록 성능이 좋다는 것을 의미합니다. B.. 더보기
[이론 공부] NLP 성능평가 Metric : 0. 개요, 1. BLEU(Bilingual Evaluation Understudy Score) 0. 개요NLP 관련 프로젝트를 진행하면서 제일 먼저 궁금했던 건 어떻게 모델의 성능을 평가하냐는 것이었습니다.그래야 어떤 목표를 가지고 성능을 올릴 수 있으니까요?ㅎㅎ 도메인마다, 서비스마다 그 성능의 지표가 달라질 수도 있고, 그 지표를 발굴하는 것도 중요하다고 생각하지만,가장 먼저, 기초적이고 전통적으로 사용해왔던 평가지표를 알아보는 것이 중요하다고 생각해서General하게 사용되어 온 지표들에 대해 하나씩 탐구해보고자 합니다.  NLP 메트릭 톺아보기기초부터 톺아보는 NLP 학습기velog.ioNLP Metric의 전체적인 분류를 너무 잘 정리해 주신 문서가 있어서 이 내용에 있는 Metric들을 바탕으로 앞으로 글을 작성해보고자 합니다. 위 문서에 따르면,NLP Processing의 Output.. 더보기
[이론 공부] 그로스 해킹 3장 - AARRR : 추천(Referral) AARRR : 5. 추천(Referral) 추천(Referral)은 AARRR의 마지막 단계이다 그렇지만 새로운 유저의 시작단계라고도 할 수 있다 친구초대 프로모션과 같은 일회성 전략이라기보다 '서비스 내에 입소문을 통한 선순환 구조를 어떻게 구축할 것인가'라는 구조를 만드는 일이다 추천을 통해 유입된 유저가 다시 추천을 하는 유저가 될 수 있기 때문에 복리의 효과를 기대할 수 있다 그렇기 위해서는 새로운 유저가 충분히 만족할만한 서비스가 구축되어 있어야 하기에(서비스를 이용하다가 추천하는 경우가 얼마나 있는지 생각해보자...ㅎ) 서비스의 성숙단계에서 활용하는 전략이 되는 것이다 다만, 데이팅 어플과 같이 내가 사용한다는 사실을 남에게 알리고 싶지 않은 서비스 등 추천이 잘 동작하지 않는 경우도 있으므로.. 더보기
[이론 공부] 그로스 해킹 1장 - 그로스 해킹이란 무엇인가? 그로스 해킹(Growth Hacking)이란? 크로스펑셔널(Cross-Functional)한 직군의 멤버들이 모여서 핵심지표를 중심으로(AARRR 등) 실험을 통해 배움을 얻고, 이를 빠르게 반복하면서(린 스타트업, MVP) 제품이나 서비스를 성장시키는 것 이다. 여기서 사용되는 개념들을 정리해보자. Cross-Functional Team : 목적기반으로 구성된 조직으로 여러 직군(개발자, 디자이너, 마케터, 데이터 분석가 등)의 구성원들이 협업하는 조직 AARRR(해적지표, Pirate Metrics) : 그로스해킹 기반의 대표적인 지표 관리 방법론. 고객 유치(Acquisition), 활성화(Activation), 리텐션(Retention), 수익화(Revenue), 추천(Referral) 다섯가지 .. 더보기
[데벨챌] 3주 - 컨버티드: 마음을 훔치는 데이터분석의 기술 Part3 일기 | 일정 1주차 - Part 1 : Chapter 2. 쉽고 단순하게 시작하라 Chapter 3. 정확한 질문을 하라 Chapter 5. 힌트를 포착하라 2주차 - Part 2 : Chapter 8. 데이터로 현실을 파악하라 Chapter 9. 가치가 높은 고객을 만나라 Chapter 12. 구글의 광고 프로젝트에서 얻은 교훈 3주차 - Part 3 : Chapter 14. 어떻게든 문제를 해결해야 하는 당신에게 Chapter 15. 작은 것부터 시작하라 Chapter 16. 때로는 정치도 필요하다 Chapter 17. 테스트를 일상화하라 4주차 - 오프라인 회고 모임 ch15 작은 것부터 시작하라 이 부분은 마케팅뿐만 아니라 어떤 일을 하든지 필요한 부분인 것 같다 완벽하지 않은 작은 개선이라고 얕보지 말.. 더보기
[데벨챌] 2주 - 컨버티드: 마음을 훔치는 데이터분석의 기술 Part2 일기 | 고객생애가치(CLV) 활용법 일정 1주차 - Part 1 : Chapter 2. 쉽고 단순하게 시작하라 Chapter 3. 정확한 질문을 하라 Chapter 5. 힌트를 포착하라 2주차 - Part 2 : Chapter 8. 데이터로 현실을 파악하라 Chapter 9. 가치가 높은 고객을 만나라 Chapter 12. 구글의 광고 프로젝트에서 얻은 교훈 3주차 - Part 3 : Chapter 14. 어떻게든 문제를 해결해야 하는 당신에게 Chapter 15. 작은 것부터 시작하라 Chapter 16. 때로는 정치도 필요하다 Chapter 17. 테스트를 일상화하라 4주차 - 오프라인 회고 모임 이번 파트들을 읽으면서 저번보다 더 구체적인 데이터 분석 방법을 알려준다는 느낌을 받았다 ch8 데이터로 현실을 파악하라 part2의 메인 .. 더보기
[데벨챌] 1주 - 컨버티드: 마음을 훔치는 데이터분석의 기술 Part1 일기 | 데이터는 도구일 뿐인걸, 어떤 통찰이라도 영원한 진리로 남을 수는 없다 일정 1주차 - Part 1 : Chapter 2. 쉽고 단순하게 시작하라 Chapter 3. 정확한 질문을 하라 Chapter 5. 힌트를 포착하라 2주차 - Part 2 : Chapter 8. 데이터로 현실을 파악하라 Chapter 9. 가치가 높은 고객을 만나라 Chapter 12. 구글의 광고 프로젝트에서 얻은 교훈 3주차 - Part 3 : Chapter 14. 어떻게든 문제를 해결해야 하는 당신에게 Chapter 15. 작은 것부터 시작하라 Chapter 16. 때로는 정치도 필요하다 Chapter 17. 테스트를 일상화하라 4주차 - 오프라인 회고 모임 이번에도 어김없이 찾아온 데벨챌 이 책의 존재도 모르고 있었는데 이렇게 알려주시니 감사합니다!! 다시 소개하자면 데이터넥스트레벨 챌린지는 데.. 더보기
[데벨챌] 3주 - 데이터문해력 4장~끝 일기 | 말같은 시야를 가진 사람이 될테야 일정 1주차 - 1장. 앞으로 필요한 건 데이터 문해력 : 분석보다 활용 2장. 올바른 데이터로 올바른 문제를 풀고 있는가? 2주차 - 3장. '이것이 문제다' 데이터로 말하는 힘 3주차 - 4장. 결과가 나왔다고 끝난 것은 아니다 5장. 기법에 집착하지 마라 4주차 - 온라인 회고 모임 제가 데이터 문해력 다 읽은 사람처럼 보이시나요? 그렇습니다 데이터 문해 능력자처럼 보이시나요? 한번 봅시다 말은 시야각이 350도라고 한다 데이터 분석할 때 그런 시야를 가지고 싶은 사람 나야나 4,5장 읽기였지만 멈추지 못하고 끝까지 다 읽어서 전체적인 리뷰를 하려고 한다ㅎㅎ 읽으면서 가장 공감됐던 내용은 '방법맨'이 되지 말라는 것이다 문제 파악 → 바아로 방법 제시로 가는 게 쉬운데 데이터로 실제 원인을 파악하고.. 더보기