일정
1주차 - 1장. 앞으로 필요한 건 데이터 문해력 : 분석보다 활용
2장. 올바른 데이터로 올바른 문제를 풀고 있는가?
2주차 - 3장. '이것이 문제다' 데이터로 말하는 힘
3주차 - 4장. 결과가 나왔다고 끝난 것은 아니다
5장. 기법에 집착하지 마라
4주차 - 온라인 회고 모임
제가 데이터 문해력 다 읽은 사람처럼 보이시나요?
그렇습니다
데이터 문해 능력자처럼 보이시나요?
한번 봅시다
말은 시야각이 350도라고 한다
데이터 분석할 때 그런 시야를 가지고 싶은 사람 나야나
4,5장 읽기였지만 멈추지 못하고 끝까지 다 읽어서 전체적인 리뷰를 하려고 한다ㅎㅎ
읽으면서 가장 공감됐던 내용은
'방법맨'이 되지 말라는 것이다
문제 파악 → 바아로 방법 제시로 가는 게 쉬운데
데이터로 실제 원인을 파악하고 그 원인을 해결하는 방법으로 나아가는 것이 바로 데이터를 활용한 문제해결 방법이라는 것이다
꼭 데이터를 활용한다는 의미가 아니더라도 '논리적 사고'를 활용하는 것이 바로 근거있는 해결방안 제시방법이 될 수 있다
논리적 사고를 거쳤는지 확인해보기 위해 아래 질문들에 답해보자
1. 어째서 (다른 수단이 아니라) 그것이 필요한지?
2. 그로 인해 어떤 것을 실현 또는 해결 가능한가?
효과적인 결과가 나올 것이라는 근거는 어디에 있는가?
사실 이번에 진행하고 있는 프로젝트에서 방법맨이 되어가고 있는 것은 아닐까라는 생각을 했었다
주제를 정하고 데이터를 수집하기 전, 이미 문제라고 생각한 것의 해결방안(서비스)를 제시하고 있었다
글쎄... 천재들은 그럴 수도 있겠다
워낙 감이 좋은 사람들 말이다
그런 사람들은 아마도 도메인 배경지식이 많고 머릿속에서 이미 있는 지식들을 활용해 바로 해결방안을 낼 수 있을지도 모르겠다
(이미 머릿속에서 그런 논리적 생각이 끝나고 결과만을 제시해서 방법맨처럼 보일 수도 있겠다)
하지만 나는 도메인 지식도 많이 알아봐야 하고, 논리를 하나하나 정리해야 나도 이해하고 남도 이해시킬 수 있기 때문에
이런 과정을 꼭 거쳐야 할 것 같다
그리고 원인을 최대한 여러가지 방향으로 생각해볼수록 신박하고 효과적인 해결방법이 나온다고 생각했는데 작가도 원인을 끈질기게 생각해보라고 한다.
여러 방면의 원인을 생각해보는 작업이 재미는 있는데 시간이 너무 오래걸려서 문제다
이런 부분에서 도메인 지식의 차이가 나타나는 것 같다
도메인.......! 공부........!
공부할거 너무 많아............!
그래도 다양한 방향의 원인파악을 도와주는 몇 가지 방법이 있다
1. 논리사고로 문제를 구조화 하기(그룹/차원 별로 나눠서 생각해보기)
2. 짝짓기(대응, 반대 등)
3. 자기 부정
그룹/차원별로 나눠서 생각해보고 그것을 구조화 하는 것!
아 이것도 좋아하는 방법이다
어떻게 모든 것을 하나로 볼 수가 있죠?
세상이 이렇게 복잡한데!
그룹은 회사 내부/외부, 임직원/업무량/고객의 차원에서 생각해보기 등의 예시가 있을 수 있다
이런 나눠진 부분에 대해 각각의 원인, 해결방안을 생각해보면 좀 더 쉬울 것이다
그 다음은 짝짓기!
작가님이 많이 쓰는 방법은 아래와 같다고 한다
개인 - 조직
방법론(하는 법) - 의식(의욕)
있다(그렇지만 할 수 없다) - 없다
사실 개인 - 조직 말고는 뭔소린지 모르겠다 예시도 없어서....
여튼간 본인만의 짝짓기 방법을 발굴하라고 한다
그럴게요!
마지막 방법은 자기부정
문제, 원인, 해결방안 할 것 없이 계속 부정해보는 것이다
이게 문제가 아니라면?
이게 원인이 아니라면?
이 해결방안이 효과가 없다면?
이 방법도 평소에 많이 사용해보는 방법인데
주의! 남의 말에 계속 이렇게 하다가는 시비터는 사람처럼 보일 수 있다ㅎㅎ
개인적으로는 이 부분이 책의 앞 부분에 나왔다면 더 좋았을 것 같다..ㅎㅎ
원인을 파악하기 위해 도메인 지식을 적용하기 전 먼저 훑어볼 수 있는 방법! 바로 그래프이다
그래프 파악이라면 그래도 가닥을 잡을 수 있을 것이다
내가 생각한 원인 후보와 문제가 진짜로 관련성이 있나 확인해보는 방법
1단계 : 시각적으로 파악하기
→ 산포도 그리기
해석방법
1. 전체적인 경향 파악하기(비례, 반비례 등등)
2. 그룹화 하기
3. 벗어나 있는 이상치 주목
4. 경향에 변화가 생기는 분기점에 주목
2단계 : 통계지표로 파악하기(선형관계 : 상관계수)
* 엑셀 : CORREL 함수
3단계 : 선형관계는 아니지만(상관계수 높지 않음) 어떤 관계가 있는 것 같을 때
전체를 부분으로 나눠서 파악해보기
이걸 읽어보니
산포도를 먼저 이용하지 않고 다른 그래프들로 삽질하던 아픈 과거가 떠올랐다
다른 그래프들은 나중에 사용하더라도 먼저 수치들의 경향을 파악하려면 산포도를 먼저 이용해봐야겠다
이걸 알았으면 기깔나는 분석결과를 가져갔을텐데.........!
상관계수는 산포도에서 어떤 선형 관계가 나타난 것 같다, 또는 그래프로는 확실히 알기가 어렵다 라고 한다면
수치를 통해 파악하는 방법이다
어느 정도가 상관이 있는거야 라고 생각했었는데 기준도 제시해준다(땡큐!)
-1 ~ -0.7 : 강한 부적 상관관계
-0.7 ~ -0.5 : 부적 상관관계
-0.5 ~ +0.5 : 약한 상관관계/상관관계가 없음
+0.5 ~ +0.7 : 정적 상관관계
+0.7 ~ +1 : 강한 정적 상관관계
이렇게 통계수치로 파악한 것들은 '결과'라고 할 수 있다
그렇다면 '결론'은 무엇인가?
책에 나온 예시로 이해하니까 편했다
젊은 부부가 우리 지역으로 이사를 오려고 한다
주거비용을 최대한 절약하려고 한다
그래서 나는 교외와 도심의 월세 비교표를 제시해서 조언을 하고자 한다(다만 비교하는 두 집은 교외/도심 조건 이외에는 비슷한 조건을 가지고 있다)
빵점짜리 조언 : 교외 지역의 평균 집세가 도심 지역의 평균 집세보다 낮습니다. (그래서 어쩌라는 거지?) (결과만 제시)
판타스틱한 조언 : 분명 시세는 교외가 도심보다 싼 편이지만, 선택의 폭을 생각하면 도심 쪽이 압도적으로 넓다고 할 수 있습니다. 그리고 도심에서 좋은 부동산을 찾아낸다면 결과적으로 교외 시세보다 쌀지도 모릅니다. 일단 도심에서부터 찾아보는 것은 어떠신지요. (결과 → 결론을 통해 해결방안을 제시)
작가님 조언 길이에서부터 너무 차이나는 거 아니에요?ㅋㅋㅋㅋㅋㅋ
여튼간 판타스틱한 조언의 중점은 평균뿐만 아니라 값 간의 편차도 이용했다는 점, 그리고 평균 → 시세, 표준편차와 분산 → 선택의 폭이라는 통계 단어를 사용하지 않고 의뢰인에게 설명하기 좋은 단어를 선택했다는 점이다
이것이 바로 결론!
이런 결론으로 현상을 파악, 평가하고 원인을 파악한 후에 해결 방안을 제시하면 되는 것이다
다 읽어보니 내용 순서나 약간은 산발적으로 느껴지는 서술이 이해하기 어려운 부분도 있었지만
이렇게 문제파악 - 해결방안 제시의 방법 자체를 깊게 고민해본 적이 없어서 뜻깊은 시간이었던 것 같다
이제는 이걸 체화해서 적용하는 것만 남았다!
나 자신 화이팅!