LG경제연구원 ‘사람에 대한 통찰력 데이터 분석으로 높인다’
서울--(뉴스와이어) 2012년 10월 28일 -- 2011년 개봉된 ‘머니볼(Moneyball)’은 성적이 하위권에 맴돌던 미국의 야구팀 오클랜드 애쓸래틱스(Oakland Atheletics)에 대한 이야기를 다룬 실화를 바탕으로 한 영화이다. 야구단의 단장 빌리 빈(Billy Beane)은 재정적으로 부유하지 않은 팀의 성적을 높일 방안을 강구하던 중, 어느 한 경제학자를 고용하여 야구 선수의 기록 등에 대한 데이터를 통계적으로 분석하는 작업을 진행하였다. 이를 통해 상대적으로 실력 대비 저평가된 선수들을 가려내어 최소한의 자금으로 영입하였고, 그 이후 4년 연속 포스트 시즌에 진출하게 된다. 기업과 야구의 생태는 다소 다르지만, 이 상황을 기업에 비유해 보면 사람에 대한 데이터를 효과적으로 분석할 수 있다면, 좋은 인재를 선발하고 적재적소에 배치함으로써 최상의 성과를 거둘 수 있다는 점을 시사하고 있다.
Ⅰ. HR에서의 데이터 기반 경영
기업의 경영자가 사람과 관련하여 가장 알고 싶어하는 것은 무엇일까? 아마도 ‘어떤 이력·특성을 가진 사람을 뽑아야 입사 후에 최상의 성과를 발휘할까?’, ‘최고의 성과를 내는 리더는 어떤 특성을 지닌 사람들일까?’, ‘회사가 어떻게 해야 구성원들의 회사와 일에 대한 몰입과 열정을 이끌어 낼까?’ 등과 같은 질문에 대한 답일 것이다. 그런데 문제는 이 같은 질문에 대해서 쉽게 답하기가 어렵다는 것이다. 사람의 특성이나 내면은 제품이나 시장(고객)처럼 숫자나 도표로 정형화하기가 쉽지 않기 때문이다. 이런 이유로 사실 그 동안 기업들은 사람에 대한 의사결정을 할 때 과거의 관행대로 하거나, 경쟁사의 HR 프랙티스를 벤치마킹 하거나, 경험 혹은 직관에 의존하는 경우가 많았다. 그러나 객관적 사실과 과학적 근거보다 과거의 관행, 개인적 경험과 직관에 의존한 의사결정은 잘못된 결과를 초래할 가능성이 높다. 특히 사람에 대한 의사결정은 한번 시행되면 그 파급효과가 크다는 면에서 더욱 합리적으로 이루어져야 한다. 이 같은 맥락에서 스탠포드(Stanford) 대학의 제프리 페퍼(Pfeffer)와 로버트 셔튼(Sutton) 교수는 요즘과 같은 치열한 글로벌 경쟁 시대에는 기존의 관행, 경험, 벤치마킹 보다는 과학적으로 입증된 증거에 의거해 의사결정을내리는 ‘증거 기반의 경영’(Evidence-based Management)이 강화되어야 한다고 역설한 바 있다.
HR 데이터에 숨어있는 성과 창출 기회
사람에 대한 데이터의 분석은 경영자가 HR 관련 의사 결정을 할 때, 보다 객관화된 증거를 제시해 줄 수 있다. 조직에서 데이터를 의사결정에 활용한다는 개념을 떠올릴 때 우리는 흔히 고객의 구매 행동 데이터를 분석하여 마케팅을 하는 것, 재무 데이터를 통해 리스크 요인을 도출하는 것, 계절적 변동을 고려해 물류 계획을 세우는 것을 연상하게 된다. 그러나 데이터를 기반으로 한 분석과 의사결정은 마케팅, 재무, 물류 분야에만 국한되는 것은 아니다. 조직 내 구성원과 관련된 의사결정은 그 결과가 조직 전체 차원의 성과에 영향을 주는 중요한 요인이라는 점에서 HR 의사결정 역시 데이터 분석을 통해 합리적으로 이루어질 필요가 있다.
조직 구성원, 즉 사람과 관련한 다양한 데이터를 분석할 경우, 위에서 언급한 경영진이 궁금해 하는 HR 관련 의사결정을 위한 질문에 대한 보다 객관적이고 설득력 있는 답을 제시해 줄 수 있다. 실제로 구글(Google), 마이크로소프트(Microsoft) 등은 직원들에 대한 다양한 데이터를 축적하고 분석하는 등 과학적인 HR 데이터 분석을 통해 경영진의 HR 의사결정을 지원하고 있다.
이처럼 사람과 관련한 데이터를 다양한 방법론과 통합적 프로세스를 적용하여 분석하는 것을 HR 데이터 분석(또는 HR 애널리틱스(Analytics)1) 이라고 한다. HR 데이터 분석의 목적은 구성원 및 조직 성과 향상에 있으며, 다양한 통계적인 기법(상관관계 분석, 회귀 분석, 경로 분석 등)을 이용하여 의미 있는 결과를 찾는 것이 최종 목표이다. 이는 단순한 이직률 집계 등의 현황 파악보다 더발전된 개념으로 향후의 인력 운영과 관련된 중요한 질문들에 답할 수 있다. ‘지금 어떤 일이 일어나고 있는가?’(직원수, 임금 등 기본 정보)를 넘어 매출, 성과 등의 데이터와 인적 데이터를 비교 분석하여 ‘어떤 인적 요인 때문에 이런 일이 발생하는가?’와 ‘앞으로 어떤 일이 일어날 수 있을 것인가?’에 대한 단서를 제공할 수 있는 것이 HR 데이터 분석인 것이다.
사람을 통한 성과 창출을 위한 의사결정을 지원하는 방법으로서 최근 주목 받고 있는 HR 데이터 분석에 대해 글로벌 기업들의 사례를 중심으로 살펴본다.
Ⅱ. HR 데이터 분석을 통한 성과 향상 사례들
1. 제록스(Xerox)의 고성과 DNA 찾기
HR 데이터 분석은 ‘어떤 기준으로 사람을 선발해야 입사 후에 고성과를 창출할 가능성이 높은가’에 대한 기준을 제시할 수 있다. 흔히 우수 인재를 선발하기 위해 많은 기업들이 주목하는 활동으로서 이력서 항목의 재조합 또는 가중치 조정, 면접 프로세스 정형화, 면접관 교육 등을 들 수 있다. 그러나 이러한 선발 프로세스 그 자체의 개선도 중요하지만, 보다 중요한 것은 “현재 우리 조직이 활용하는 선발 기준을 통과하고, 면접 프로세스를 거쳐 입사한 사람들이 성과를 낼 것인가”를 예측하는 것이다. 이를 가능케 하는 방법 중 하나는 ‘현재 조직 내부의 고성과 직원들의 특성을 파악하여, 선발 기준 및 면접의 중점 점검 포인트로 삼는 것’을 들 수 있다.
제록스는 콜센터 직원들의 입사 후 조기이직률이 매우 높아 고민에 빠진 적이 있었다. 1인당 약 5,000달러 가량의 금액을 신입사원 교육에 투자함에도 불구하고 곧 이직해 버리니 제록스로서는 상당한 손해가 아닐 수 없었다.
채용방식의 근원적인 변화가 필요하다고 생각한 제록스는 콜센터 직원들 중에서 (i) 성과가 우수하고, (ii) 장기 근속하는 직원들을 대상으로 인적 사항에 대한 자료를 수집하고, 설문조사를 통해 ‘성격(Personality)’ 특성을 파악하였다. 이 같은 데이터를 기초로 하여 제록스에서의 ‘가장 이상적인 콜센터 직원 특성’을 도출하였다. 데이터 분석 결과, 제록스가 지금까지 갖고 있었던 훌륭한 콜센터 직원에 대한 이미지를 뒤엎는 결과가 나왔다. 주요 결과를 보면, 첫째, 제록스가 이전까지 가장 큰 의미를 두었던 ‘이전 직장에서의 근무 경험’이 아니라 ‘성격’ 요인이, 둘째, 성격 중에서도 ‘창의적인 유형’이 입사 후 근속기간 및 성과에 가장 큰 긍정적인 영향을 미치고 있었다는 점을 밝혀 내었다.
이러한 데이터 분석 결과를 바탕으로 제록스는 콜센터 직원 선발 시, 직무 수행 과정에서 겪을 수 있는 다양한 시나리오에 기반한 성격 테스트(약 30분 소요)를 시행하였다. 이 테스트 점수의 결과를 근간으로 입사후보자를 잠재력이 높은 그룹(Green), 보통 그룹(Yellow), 낮은 그룹(Red) 등 세 그룹으로 구분하였고, 잠재력이 높은 그룹을 중심으로 선발하였다. 그 결과, 채용한 콜센터 직원의 조기이직률은 새로운 채용 제도 시행 6개월 만에 이전의 1/5 수준으로 개선되었다.
2. PNC 파이낸셜(Financial)의 ‘외부 영입 vs. 내부 충원’ 고민 해결
다양성에 기반한 창의성이 중시되면서, 최근 많은 기업들이 외부로 눈을 돌려 경력자의 채용을 늘려가고 있다. 그럼에도 여전히 조직 입장에서는 많은 보상을 제공하고 영입하는 경력자들이 과연 성과를 잘 내고 있는가에 대해서는 확신을 갖지 못하고 있다. HR 데이터 분석은 ‘외부에서 사람을 채용할 것인가, 아니면 내부의 사람을 활용할 것인가’에 대한 판단의 기준을 제공해 줄 수 있다.
미국 피츠버그주에 본사를 두고 있는 PNC 파이낸셜은 미국 내 자산규모 LG경제연구원 ‘사람에 대한 통찰력 데이터 분석으로 높인다’ - 뉴스와이어 6위의 상업은행이다. 동사의 그 간의 인력 채용에 대한 기조는 공석 발생 시 내부의 구성원을 승진·이동 시켜 공석을 메우기 보다는 경험이 풍부하다고 여겨지는 경력자들을 외부에서 충원하는 방식이었다. 그러나 조직 내부적으로는 경력자들이 돈을 많이 받는 만큼 성과를 잘 내고 있는가에 대해 회의적인 시각이 많았으며, 이로 인해 현재 회사의 경력 채용 방침이 과연 옳은가에 대한 의구심이 제기되고 있었다.
이러한 이슈를 포착하게 된 인사팀은 2009년, 데이터 분석에 능숙한 시장분석팀의 협조 하에 지난 수년 간 채용한 외부 경력자와 내부에서 승진한 구성원간의 영업성과를 추적하여 데이터로 만들고, 이 두 집단의 성과를 비교하는 작업을 추진하였다. 분석 결과, (i) 대부분의 직무에서 부임 첫 해 내부 승진자의 성과가 외부 경력직의 성과보다 현저히 높았으며, (ii) 시간이 지날수록 성과의 격차는 줄어들었지만, 여전히 내부 승진자의 성과가 지속적으로 우월한 것으로 나타났다. 이처럼 PNC 파이낸셜은 ‘성과도 안 좋은데, 괜히 많은 돈 들여서 외부에서 사람을 뽑는 건 아닌가’ 하는 사람들의 궁금증을 데이터를 통해 증명하였고, 이후 공석 발생 시 내부 구성원을 승진시켜 보임하는 방식으로 인력 충원 전략을 수정하였다.
3. 구글(Google)의 베스트 리더 특성 찾기
‘베스트 리더의 요건은 무엇인가’ 이 질문에 대한 답은 거의 모든 경영진들이 찾고자 할 것이다. 그 만큼 탁월한 성과를 낼 수 있는 리더, 구성원들이 존경하는 리더를 선발하고 육성하고자 하는 기업들의 열망은 매우 크다는 의미다. 이에 많은 기업들은 리더들의 성과 또는 경력 이력을 관리하는가 하면, 다면평가 등을 통해 리더십을 측정하고 있다. 그러나 이 같은 리더십에 대한 데이터가 지속적으로 축적되어 활용되지 않고, 단순히 리더 개인별로 연말에 1회성으로 제공되는 피드백으로 그치는 경우가 대부분이다. 반면 리더와 관련한 HR 데이터를 효과적으로 분석하면 앞서의 ‘우리 회사에서 고성과를 내고, 존경 받는 베스트 리더는 누구인가’에 대한 답을 어느 정도는 도출할 수 있으며, 이는 리더의 선발 및 육성에 가치 있는 의사결정 자료로 활용될 수 있다.
세계에서 가장 많은 데이터를 다루는 기업답게 구글은 자사의 HR 데이터 역시 과학적 분석을 통해 효과적인 HR 의사결정에 활용하고 있다. 구글은 심리학, 공학, 경영학(MBA) 출신들로 구성된 ‘구글 인재 분석팀(Google People Analytics Team)’을 운영하고 있으며, 이 팀은 성과가 높은 ‘효과적인 리더’의 특징들을 도출하여 리더의 승진 및 교육에 활용하고 있다. 구체적으로 보면, 구글의 인재 분석팀은 성과가 높고 장기 근속하는 리더들에게는 공통적인 리더로서의 자질이 있을 것이라고 예상하고, 이를 도출하기 위해 인터뷰, 설문조사를 실시한 후 결과를 데이터화 하여 분석하였다. 이러한 작업을 통해 ‘효과적인 리더가 되기 위해 필요한 8개의 좋은 행동(Good Behavior)’ - 좋은 코치가 되어라, 팀에 권한을 위임하고 지나치게 세세하게 간섭하지 말아라, 팀원과의 소통에 노력하고 의견을 경청하라 등- 과 ‘비효과적인 리더들이 빠지는 3가지 함정’ - 개인 성과는 탁월하지만 관리자로서의 역량은 부족하다 등 - 을 도출해 내었다.
또한, 구글의 분석팀은 좋은 리더에 대한 기존 관념과는 차이가 있는 한 가지 흥미로운 데이터 분석결과를 얻었다. 예컨대, 구글은 IT 기업이라는 특성상 기술적 전문성이 좋은 리더의 중요한 자질일 것이라고 생각하였으나, 데이터 분석 결과에서는 부하들의 개인적인 삶과 경력개발을 지원하는 리더십이 기술적 전문성보다 상대적으로 더 중요한 것으로 나타났다. 또한 좋은 리더들이 모든 부하들과 1:1로 대화하는 경향이 있는 반면, 나쁜 리더들은 특정 부하하고만 1:1 대화 시간을 갖거나 대화를 거의 하지 않는 것으로 나타났다. 구글은 이 같은 분석 결과를 활용하여 좋은 리더의 요건들을 자사의 리더십 교육 프로그램에 반영하여 코칭하였다. 그 결과 1년 후에 리더십의 보완이 필요했던 리더들의 약 75%에서 문제점이 눈에 띄게 개선된 것을 발견할 수 있었다.
4. 로위스(Lowe's)의 구성원 몰입 향상 활동
기업들은 구성원들의 조직몰입이나 직무만족도를 살펴보기 위한 설문조사를 매년 실시하곤 한다. 이는 ‘구성원이 회사에 충성하고 몰입할수록, 담당하는 직무에 만족할수록, 기업 성과도 높아질 것이라는 가정(Assumption)’에서 출발한 것이다. 그러나안타깝게도 다수의 기업들은 설문조사를 통해 얻어진 데이터를 일차원적으로만 활용하고 있는 듯 하다. 예컨대, ‘직무에 만족하는 직원이 몇 퍼센트이다’, ‘작년에 비해서 몰입도가 몇 퍼센트 상승하였다’, ‘어떤 부서의 조직에 대한 충성도가 가장 높다’ 등과 같이, 설문조사 자료를 단순히 기술하는 수준에 그치고 있다. 상황이 이렇다 보니, 경영자나 조직의 리더들은 “직원들의 몰입이나 만족도를 높이는 것이 정말 중요한가? 그러면 사업성과도 좋아지는가?”에 대해 확신하지 못하고, ‘그저 매년 직원들 불평이나 수렴하는 조사’로 폄하하곤 한다.
반면, 설문조사를 바탕으로 얻은 HR 데이터를 과학적으로 분석·활용하면, 설문조사의 본질적인 목적인 ‘구성원의 몰입과 만족을 높이면 사업성과를 높일 수 있다’는 가정을 검증해 볼 수 있으며, 이를 토대로 직원의 몰입과 만족을 높이기 위한 후속 조치들을 과감하게 추진할 수 있다.
2011년 기준 포춘(Fortune) 50위 규모의 가정용품 소매전문 기업인 로위스는 사업성과(매장 매출, 고객만족도 등)에 인적자원의 특성(구성원 몰입도, 리더십 등)이 과연 얼마나 영향을 미치는가를 데이터 분석을 통해 규명한 바 있다. 로위스의 인사부서는 HR이 사업의 성공에 기여하기 위해서는 과학적, 체계적 데이터 분석을 기반으로 하는 HR이 되어야 한다고 생각하였다. 이를 위해서 인사부서는 동사의 구성원들의 특성들이 실제 사업성과를 높인다는 점을 증명해야 한다고 판단하고, 인적자원 및 사업성과 등 다양한 데이터들을 수집하여 통합적으로 분석하였다.
데이터 분석 결과, 조직에 대한 몰입도가 높은 직원들이 고객을 응대할 경우, 매장의 매출이 약 4% 정도 더 높아지며, 그로 인해 직원들의 조직 몰입도가 높은 매장과 그렇지 않은 매장간의 매출 차이가 약 100만 달러에 이른다는 점을 밝혀 내었다. 로위스의 인사부서는 이러한 몰입도와 매출간의 관계에 대한 분석결과를 회사의 경영진들에게 시각화하여 보고하였으며, 로위스의 경영진들은 구성원의 몰입도가 사업에 매우 중요한 요인임을 이해할 수 있었다. 이후, 로위스는 구성원의 몰입도를 높여야 하는 매장이 어디인지, LG경제연구원 ‘사람에 대한 통찰력 데이터 분석으로 높인다’ - 뉴스와이어 어떤 직원을 매장 리더로 선임하고 교육해야 구성원들의 몰입도를 높일 수 있는지에 대해 이전보다 훨씬 더 집중적으로 개선활동을 전개할 수 있었다.
5. PWC의 신규 보상제도의 사전 효과 검증
통상적으로 새로운 인사 제도의 시행에는 상당한 재원이 소요된다. 특히, 직원에 대한 보상과 관련한 제도에는 상당한 돈이 추가로 투자될 수 있다는 점에서, ‘새롭게 추진하고자 하는 인사 제도가 효과적인 것인가’를 검증하는 것은 매우 중요한 의사결정 사안이라 할 수 있다. HR 데이터 분석은 조직이 계획하거나 시행하고 있는 인사제도의 효과성을 검증하거나 예측하는 데에 유용할 수 있다.
회계·컨설팅 서비스 업계의 글로벌 기업인 프라이스워터하우스쿠퍼스(PWC)는 한 때 세무회계분야의 3~5년 차 경력의 시니어 직원들의 이직이 높아지는 문제에 봉착한 적이 있었다. 시니어 직원의 이직이 지속적으로 높아질 경우, 중간 허리 계층의 공백에 따른 조직관리가 부실해 지고, 노하우가 사라져 기업의 경쟁력도 떨어질 것이 우려되었다. PWC는 시니어 계층의 이직 방지를 위해, 보상의 일정 금액을 일정 기간 또는 퇴직 시까지 미루었다가 지급하는 이연보상(Deferred Compensation) 제도를 시행하는 방안을 계획하였다. 그러나 PWC는 이연보상 제도가 과연 시니어 계층의 장기 근속을 촉진할 수 있는가에 대한 확신이 없었기 때문에, 데이터 분석을 통해 시행 여부를 결정하기로 하였다. 이와 더불어, 동사는 PWC에서 오랫동안 일하는 것이 이직하는 것보다 더욱 성공적인 삶을 살 수 있다는 점을 직원들에게 데이터를 통해 증명해 보여준다면 이직을 방지할 수 있을 것이라고 생각하였다.
이에 PWC는 미국의 남가주 대학(University of Southern California)의 조직효과성센터(Center for Organization Effectiveness)와 공동으로 구성원들의 근속을 결정하는 요인, 이직한 사람들이 다니는 직장 및 보상 수준 등에 대한 데이터를 수집하고 분석하였다. 분석 결과, 직원들이 PWC에 근무할 것인가를 결정함에 있어서 가장 중요한 요인은 현 시점 또는 미래(퇴직 시점 등)에 받을 수 있는 보상의 크기가 아니라, 근속기간에 따라 비례한 보상의 증가로 나타났다. 이는 애초에 계획하던 이연보상이 직원들의 장기근속을 촉진하는 데에 효과적이지 않을 수 있음을 보여주는 것이었다. 또한 PWC에서 계속 근무하는 구성원들과 이직한 사람들간의 직급 및 보상 수준을 비교한 결과, 전반적으로 PWC의 장기근속자들이 직급도 높고 보상도 더 많이 받는다는 사실을 알게 되었다. 이러한 데이터 분석 결과를 바탕으로 PWC는 이연보상 계획을 취소하고, 구성원들에게는 PWC에서 장기 근속하는 것이 이직하는 것보다 승진 및 보상에 있어서 더욱 유리하다는 사실을 전파하고 설득하였다. 이러한 일련의 활동을 통해, 시니어 계층의 이직률을 4년 전의 26%에서 10% 수준까지 낮출 수 있었다.
Ⅲ. HR 데이터 분석이 성공하려면
앞서 살펴본 사례에서 보듯이 HR 데이터 분석은 경영진들이 사람과 관련한 의사결정 시에 궁금해 하는 점을 해결해 주는 데에 도움을 줄 수 있다. 그러나 HR 데이터 분석이 성공적으로 시행되기 위해서는 신중한 접근과 각별한 노력이 필요하다. 그 중 몇가지를 예시하면 다음과 같다.
분석에 필요한 데이터 수집 및 관리 시스템을 구축해야…
HR 데이터를 분석하고 싶어도 정작 조직 내에 적절한 데이터가 축적되어 있지 못하여 분석할 수 없는 상황에 직면하지 않도록 데이터 수집 및 관리 시스템을 구축하는 데에 노력할 필요가 있다. 흔히, 성과평가결과, 보상 데이터 등은 기업들이 체계적으로 관리하고 있다고 생각하지만, 미국의 한 컨설팅 업체(Knowledge Infusion)가 인사담당자 259명을 대상으로 실시한 설문조사(2009년)에 의하면, 이러한 기본적인 인적자원 관련한 데이터를 갖춘 기업은 45% 수준으로 절반에도 미치지 못하는 것으로 나타났다고 한다.
우선, HR 데이터 분석에 필요한 데이터들이 무엇인지를 명확히 정의하고, 이들 데이터를 꾸준하게 수집하는 시스템을 갖추는 노력이 필요하다. 한편, 앞서의 글로벌 기업의 사례에서 보듯이 HR 데이터 분석에는 비단 인사나 구성원과 관련된 데이터만이 활용되는 것은 아니다. 고객만족도, 매출자료 등 마케팅, 재무 등의 데이터도 함께 활용되면 데이터 분석의 힘을 더욱 높일 수 있기 때문이다. 따라서, 다양한 부서와의 협조를 통해 다양한 데이터들이 공유되고 활용될 수 있도록 전사 차원에서의 통합적인 데이터 관리 체계를 갖추는 데에도 신경 써야 한다.
목적에 부합하도록 데이터와 분석 방법을 디자인해야…
단순히 ‘데이터가 있고, 통계적 지식이 있어서 여러 데이터들을 분석하는 것’은 조직 차원의 의사결정에 가치를 주지 못한다. 경영진이 사람을 통해 성과를 내는데에 있어서 궁금해 하는 이슈에 대한 단서를 제공하려는 목적에 맞도록, 이에 적합한 데이터를 선택하고 분석 방법을 디자인해야 실제 의사결정에 활용할 수 있을만한 결과들을 내놓을 수 있을 것이다. 열심히 데이터를 모으고 분석했지만 정작 의사결정에 활용되기 어려울만한 결과를 내놓는 소위 ‘분석 따로, 결정 따로’의 현상은 HR 데이터 분석에 있어서 경계해야 할 사안이다.
어설프게 분석하여 잘못된 결정을 내리지 않도록…
요즘 빅 데이터(Big Data)를 비롯하여 데이터에 기반한 경영이 주목을 받고 있다. HR 데이터 분석도 이 같은 경영의 흐름에 속하고 있다고 볼 수 있다. 2011년 기준, HR 관련 소프트웨어 시장은 전년 대비 15% 증가한 38억 달러에 이른다는 리서치 기관 가트너(Gartner)의 조사는 HR 데이터 분석에 대한 기업들의 수요가 증가하고 있음을 보여주는 예이다. 그러나, 정작 HR 데이터 분석을 할 내부적 역량이 갖춰 지지 않은 상태에서, 경영의 시류에 휩쓸려 어설프게 분석한다면 엉뚱한 분석결과를 얻게 되어 잘못된 의사결정을 할 수 있다. 실제 기업들의 HR 데이터 분석 역량은 아직 충분히 갖춰지지 못한 상태인 듯 하다. 미국의 인사분야의 연구기관인 Bersin & Associates가 약 600여명의 인사담당자를 대상으로 시행한 설문조사(2011년)를 보면, 약 56%가 HR 데이터를 수집, 측정, 분석하는 데에 매우 취약하다고 응답한 것으로 나타났다고 한다. 따라서, 조직 내의 사람 관련 이슈의 원인 및 결과 등을 제대로 도출하기 위해서는 데이터 분석에 능숙한 전문성(통계 지식 등)과 HR 데이터 분석에 대한 경험을 보유한 인력을 확보하는 것도 간과해서는 안 된다. 글로벌 기업들이 HR 데이터 분석 담당자를 채용 시, 통계 전문가, MBA 전공자, 산업·조직심리학 석사 학위 보유자 등 숫자에 대한 이해와 분석 역량을 요구하는 것도 이 때문이다.
사람에 대한 이해가 반드시 전제되어야…
HR 데이터 분석의 궁극적인 목적은 ‘사람을 통한 성과 향상’에 있다. 이는 데이터를 분석하는 것만이 능사가 아니라, 사람에 대해 잘 이해하고 있는 것이 더 중요하다는 의미이다. 사람에 대한 이해가 충분하지 않다면, 제 아무리 많은 데이터를 다양한 기법으로 분석을 하더라도, ‘왜 그러한 결과가 나왔는가’를 설명하기 힘들 것이다. 따라서, HR 데이터 분석에 참여하는 사람들은 통계 전문가들만이 아니라 인사담당자를 포함하여 사람에 대한 이해를 잘 하고 있는 사람들이 함께 분석하고 그 결과를 해석해야 할 것이다.
손자(孫子)가 말한 상대를 알고 나를 알면 백 번 싸워도 위태롭지 않다는 뜻의 ‘지피지기 백전불태 (知彼知己 百戰不殆)’에 대해서 우리는 흔히 나를 아는 것보다는 상대를 아는 것 쪽에 더 초점을 두어 해석하는 경향이 있다. 기업의 경우에도 현재 내부적인 상태나 문제점보다는 경쟁사의 베스트 프랙티스나 장점을 알아내는 데에 치중하고 있는 면이 많은 것으로 보인다. 그러나 상대를 잘 알더라도 정작 자신을 모른다면 치열한 경쟁에서 살아남기가 어렵다. HR 데이터 분석을 통해 구성원과 조직 운영의 현황과 문제 등 ‘나 자신’을 더 잘 알게 된다면 더 나은 의사결정이 가능해질 것이다. [LG경제연구원 원지현 연구원]
경제적 자유를 준비하는 개발자
통계청에서는 "뉴스기반통계검색서비스"라는 시스템을 운영하고 있는데요, 온라인에서 수집한 뉴스 빅데이터를 기반으로 경제와 농축수산물 부문에 대한 키워드 분석 결과 및 통계 자료를 검색할 수 있는 기능을 제공한다고 합니다.
몇 시간 동안 LG경제연구원 ‘사람에 대한 통찰력 데이터 분석으로 높인다’ - 뉴스와이어 직접 사용해보니 꽤나 재미있는 서비스였는데요, 아래에서 자세하게 알아보도록 하겠습니다.
통계검색 원리
- 웹 크롤링, 자연어 처리 등 최신 빅데이터 수집 및 분석 기술을 활용하여 뉴스 수집을 합니다.
- 문장의 형태소 분석 및 키워드 간 관계망 분석을 합니다.
- 자체 구축한 부문별 용어사전을 이용하여 정제한 키워드 분석 결과를 주간 단위로 보여줍니다.
홈페이지 접속하기
통계청의 "뉴스기반통계검색서비스"는 위 링크를 통해 접속할 수 있습니다.
홈페이지 파악하기
위 홈페이지를 타고 들어가면 "뉴스기반통계검색서비스" 시스템이 나옵니다.
조회 기간, 검색어, 주요 키워드가 한눈에 보이네요.
우선 위 검색 결과를 보면 2020년 10월 4일부터 12월 5일까지 코로나19, 백신, 부동산 순으로 많은 키워드가 추출된 걸 알 수 있습니다.
해당 기간에 뉴스기사에서 자주 쓰던 키워드이기 때문에 요즘 사회의 관심사라고 봐도 되는 것입니다.
오른쪽 화면을 보면 "관련 키워드 관계망"이라는 탭이 있는데요, 어릴 때 많이 그려봤던 마인드맵과 같은 형식으로 키워드 간 연관성을 연결해주는 장치입니다.
코로나 19로부터 시작해서 확진자, 미용실, 방역당국 순으로 연결되는 것을 보니 추천해주는 알고리즘이 꽤나 관련성이 높다고 생각되네요.
바로 그 밑을 보면 키워드와 관련된 뉴스가 몇건인지 출력이 되고, 기사를 누르면 언론사의 홈페이지에 접속을 해서 기사를 바로 볼 수 있는 구조입니다.
직접 사용해보기
1. 키워드 클릭
위 많은 키워드 중에서 "ESG"를 클릭해 보았습니다.
클릭했더니 오른쪽 그림처럼 ESG와 관련된 키워드가 쭈르륵 출력이 되고 있습니다,
역시 ESG와 매우 크게 관련된 에너지, 지배구조, 친환경과 같은 키워드가 큰 키워드 제목으로 출력이 되고 있네요.
2. 조회기간 검색
이번에는 조회기간을 바꿔서 2019년 2월 24일부터 2019년 11월 16일로 설정해 보겠습니다.
이때에는 코로나 사태가 아직 터지기 전이네요.
인공지능, 중소기업, 미중간 무역분쟁과 관련된 이슈가 굉장히 많았던 때였습니다.
그리고 미세먼지에 대한 온 국민적 관심이 컸었네요.
무역분쟁 키워드를 클릭하니 왼편 하단에 관련 뉴스 기사량 추이가 나오는데요, 실제 무역분쟁과 관련된 기사가 언제 많이 나왔는지를 확인해볼 수 있습니다. 위 데이터에 따르면 5월 11일을 기점으로 7월까지 많은 기사가 출간되었었네요.
3. 검색어 직접입력
시스템은 키워드를 직접 입력하여 검색하는 시스템도 지원하고 있습니다.
"증권사"라는 키워드를 입력해 보았는데요, 위처럼 투자의견, 외국인, 증시분석과 같은 증권사와 관련된 키워드가 주로 출력되고, 관계망에서도 의미 있는 키워드가 출력되고 있네요.
증권사와 관련된 뉴스도 확인해볼 수 있습니다.
지금까지 통계청에서 제공하는 "뉴스기반통계검색서비스"에 대해 알아보았습니다.
빅데이터 분석 기법을 이용하여 아주 빠른 속도로 키워드 간 연관성을 계산해서 사용자에게 보여주는 방식인데요, 실제로 써본 결과 굉장히 빠르고 정확했습니다.
IT회사에서만 들어봤던 빅데이터 및 자연어 처리 기법이 언제부터인가 공공기관에서도 많이 사용하는 일반적인 기술이 되었네요.
블로거를 위한 서비스?
개인적으로 볼 때에는 이 서비스는 블로거들이 사용하면 좋다고 생각이 들었습니다.
포스팅을 할 때 어떤 주제로 적어야 할지 고민되는 날이 많았던 적은 블로거들이라면 누구나 경험해보셨을 텐데요,
키워드 검색을 통해 여러 가지 주제에 대한 아이디어를 제공받을 수 있을 것 같습니다.
여러가지 방면으로 다양하게 활용될만한 가치가 충분한 서비스로 생각되는데요, 앞으로도 이런 기능이 더 많아져서 생각할 수 있는 길이 많이 열렸으면 좋겠습니다.
경제 뉴스 분석
나는 2020.02.20부터 주식을 시작하기 시작했다. 시작한 이유는 아주 단순하다. 저 날이 훈련소 입소일이었고, 매우 간단한 귀납적(?)인 사고로부터 "지금까지 올랐으니 추후에도 오를 거야!"라는 생각으로 전재산을 미국 주식에 투자 후 유유히 떠났다. COVID 19 패닉으로 가격이 폭락했고, 고점에 물린 김에 가치 투자 및 장기 투자자가 되었다. 다양한 주식 용어를 공부하면서 매일 뉴스들을 살펴보면서 미연준의 금리, 투자한 회사들의 현금 흐름 등에 관한 기사를 많이 읽었다. 하지만, 내 직업이 금융 애널리스트나 펀드 매니저가 아니기에 시간 투자가 한정적이었다. 그래서 금융 기사 속에서 나오는 키워드들을 정리한 후, 시각적으로 보여주는 프로그램을 만들면 좋겠다는 생각이 들었다. 재테크에 쏟는 시간도 아낄 수 있으며, Kaggle처럼 정제된 데이터가 아닌 Raw Data를 사용하는 측면에서 데이터 및 관련 기술들을 다루는 능력이 향상될 거라 생각하여 시작하게 되었다.
개발 환경 - Google Colab
구글에서 제공하는 Colab(코랩)이라는 개발 환경을 사용한다. 인터넷과 구글 계정만 있다면, 따로 개발 환경을 위한 세팅을 하지 않고도 언제든 파이썬을 사용할 수 있게 해 주어 매우 편리하다! (KoNLPy 설치할 때 진가를 발휘한다.) 따로 개발 환경을 위한 세팅을 하지 않고도 언제든 파이썬을 사용할 수 있게 해 준다.
- https://colab.research.google.com/
위 URL 또는 구글에서 Colab을 검색해서 접속이 가능하다.
Colab 시작
로그인 후 좌측 상단에서 파일→새노트 를 클릭하여 파이썬 개발 환경을 시작할 수 있다!
이때, 위 그림과 같이 Colab에서 코드를 작성하는 부분의 단위를 '셀'이라고 한다. 셀에 코드를 입력하여 Shift + Enter 키를 눌러서 코드를 실행할 수 있다.
웹 스크래핑 준비 - Selenium, Matplotlib, Newspaper3k
Local에서 Selenium을 사용하기 위해서는 Chromedriver.exe 실행 파일을 통해 스크래핑을 실행하게 된다. 하지만 Colab에서는 따로 실행파일을 다운로드할 필요 없이 코드를 통해 Selenium을 실행할 수 있다.
Colab에서 몇 가지 차트를 그려볼 텐데, Colab에서 차트를 그릴 때 차트에서 한글이 깨지지 않도록 하기 위해서는 우선 아래의 코드를 실행해주어야 한다. 아래의 코드는 Colab에서 한글을 사용하기 위해 세팅하는 용도일 뿐, 코드를 이해하지 않아도 상관없다.
한국어 텍스트를 처리할 때는 주로 형태소 분석기를 사용해서 자연어 처리를 한다. 이를 사용해서 문장에서 형태소 단위 또는 명사 단위를 뽑아낼 수 있는데, 이를 문장을 문장보다 작은 단위인 토큰 단위로 뽑아냈다고 하여 '토큰화'라고 부른다. 명사 토큰화 작업을 해주기 위해, 형태소 분석 패키지인 KoNLPy를 설치한다. Local에서 KoNLPy를 설치하기 위해서는 JDK 및 JPype1 설치가 필요했지만 Google Colab은 그 과정이 없기에 아주 편리하다. (JDK 설치를 해본 사람은 알겠지만 환경 변수 설정 등이 매우 번거롭다.) 추가로 그밖에 필요한 패키지들을 설치한다.
금융 기사 스크래핑
금융 기사는 파이낸셜 뉴스의 국제 경제 카테고리에서 가져온다.
파이낸셜 뉴스 html 구조
위에서 get_urllist()를 통해 urllist가 생성된다. 다음은 newspaper3k를 통해서 만들어진 함수로 url 리스트를 알려주면 이를 통해 뉴스의 제목과 내용을 열로 가지는 데이터프레임을 생성하는 함수이다.
Economics News DataFrame
위와 같은 코드로 우리는 다음과 같은 데이터프레임을 얻을 수 있다. 다음 글에서는 얻은 데이터프레임을 바탕으로 명사 토큰화와 불용언 처리를 통해 뉴스에 어떤 단어가 분포되어 있는지 알아보자!
경제 뉴스 분석
잠재 성장률에도 한참 못미쳐
수출 부진 탓 제조업 성장률 뚝
“추경 편성,주택 경기 부양 등
내수 대책도 약발 떨어져” 우려
우리 경제가 지난해에도 또 다시 2%대 중반(2.6%) 성장하는데 그쳤다. 최근 5년간 벌써 3번째 2%대 성장이자 3%대 초반으로 추정되는 우리 경제의 잠재적인 성장능력(잠재성장률)조차 계속 밑도는 수준이다.
정부는 여전히 당장은 3%(올해 성장 목표), 장기적으론 4%대(박근혜 정부의 국정목표) 성장세 회복을 외치고 있지만, 전문가들 사이에선 이러다 한국이 2%대 저성장 국면에서 벗어나기 힘들 거란 잿빛 전망이 팽배하다. 세계적인 장기불황과 급속한 고령화, 높은 가계부채 등 안팎의 성장 위협을 넘어설 특단의 대책을 주문하는 목소리가 갈수록 높아지고 있다.
‘수출 쇼크’에 휘청, 내수 약발은 불안
한국은행이 26일 발표한 ‘2015년 4분기 및 연간 국내총생산(속보)’에 따르면 작년 우리나라의 실질 국내총생산(GDP) 성장률은 2.6%로 2012년(2.3%) 이후 3년 만에 가장 낮은 수준에 머물렀다.
지난해 우리 경제의 발목을 잡은 건 무엇보다 수출 부진이었다. 작년 연간 수출 증가율(0.4%)은 글로벌 금융위기 직후였던 2009년(-0.3%) 이후 6년 만에 가장 낮았다. 세계적인 불경기 속에 우리 제품을 찾던 선진ㆍ신흥국들의 수요가 급감했기 때문이다. 수출에서 수입액을 뺀 ‘순수출’이 전체 성장률에 기여하는 정도(성장기여도)도 -1.2%포인트로 2010년(-1.4%포인트) 이후 5년 만에 다시 마이너스를 기록했다. 성장 버팀목이었던 수출이 오히려 성장률을 깎아먹었다는 의미다.
이 여파로 수출의 주력부대인 제조업 성장률도 크게 낮아졌다. 작년 국내 제조업은 1년 전(4.0%)보다 크게 떨어진 1.4% 성장에 그쳐 역시 2009년(-0.5%) 이후 최악의 성적을 기록했다.
흔들리는 수출과 제조업을 그나마 붙잡은 건 각종 부양책에 힘입은 내수였다. 작년 민간소비(2.1%)와 건설투자(4.0%)는 각각 전년(1.8%, 1.0%)보다 성장폭을 키우며 내수의 성장기여도를 3.7%포인트까지 끌어올렸다. 정부의 추경예산 편성과 블랙프라이데이 등 소비활성화 정책, 저금리 속 주택경기 부양책 등이 맞물린 결과다.
하지만 이마저도 점점 약발이 떨어지는 것 아니냐는 우려가 커지고 있다. 작년 4분기 성장률은 6분기 만에 0%대를 벗어난 작년 3분기(전기대비 1.3%)의 기세를 잇지 못하고 다시 0%대(0.6%)로 떨어졌다. 주택거래 증가세 둔화의 영향으로 건설투자 증가율(-6.1%)이 3분기(5.0%)보다 크게 낮아진 타격이 컸다. 개별소비세 인하 등 조치로 민간소비(1.5%)는 여전히 회복세를 이어갔지만 이마저도 새해 들어 정부의 부양책이 끊기면서 ‘소비 절벽’ 사태를 맞을 거란 우려가 적지 않은 상황이다.
수년 전부터 전문가들 사이에선 ‘우리 경제가 장기 저성장 국면에 들어섰다’는 경고가 끊이지 않았다. 우리 경제 수준에 비해서 1, 2%대 성장이 고착화된 선진국 경로에 지나치게 빨리 진입할 수 있다는 것이다.
실제 우리 경제의 최근 성장 추세를 보면 3%대 성장률이 오히려 예외적인 상황으로 받아들여질 정도다. 2009년(0.7%) 글로벌 금융위기의 여파를 겪은 우리 경제는 2010년 6.5%의 깜짝 반등에 성공했으나 2011년부터는 줄곧 2~3%대 성장세에 머물고 있다.
특히 최근 들어선 잠재성장률 수준에조차 못 미치는 경우가 잦아지고 있다. 한은이 추정한 2011~2014년 잠재성장률 수준은 3.2~3.4%로 이 기간 중 실질성장률은 2011년(3.7%)과 2014년(3.3%)에만 이에 부합하는 수준을 보였다. 작년 성장률(2.6%)은 2015~2018년 잠재성장률(3.0~3.2%)에 한참 못 미치는 것이다.
올해 전망도 밝지 않다. 연초부터 불어닥친 글로벌 금융시장 불안세에 중국의 경기둔화 우려, 원자재가 폭락에 따른 신흥국들의 경기하강 위협 등 우리 수출을 위협하는 요인들이 수두룩하다. 관세청 집계에 따르면 이달 1~10일 수출액(85억2,400만달러)은 1년 전에 비해 22.5%나 급감했다.
작년 성장률을 떠받쳤던 민간소비와 건설투자 역시 올해는 꺾일 가능성이 높다. 1,200조원에 달하는 가계부채가 상시적인 소비 제약요인으로 작용하는데다, 최경환 전 경제부총리의 퇴장으로 공격적인 부동산 부양정책도 더는 기대하기 어려운 상황이다. 대한상공회의소가 최근 대도시 소매유통업체를 대상으로 조사한 1분기 경기전망지수는 96에 머물러 3분기째 기준치(100) 이하에 그치고 있다.
정부는 저성장 고착화를 막기 위해 올해도 총력전을 펼 태세다. 우리 힘으로 조절하기 어려운 대외 여건과 별개로, 민간과 내수 중심의 회복세를 지속하기 위해 1분기부터 최대한 재정집행률을 높인다는 계획이다. 또 작년 하반기 재미를 봤던 코리아 블랙프라이데이 등 대규모 할인행사를 정례화하고 올해부터는 실질성장률에 물가상승률까지 더한 경상성장률을 함께 제시하며 국민의 체감경기 관리에도 나서기로 했다.
하지만 누적된 요인들이 복합돼 나타나는 저성장 국면이 쉽게 방향을 틀 수 있을지는 미지수다. 전문가들 역시 뾰족한 해법을 내놓지 못한다. 그만큼 지금 한국 경제가 처해 있는 현실이 간단치 않다는 얘기다. “저소득층 중심의 재정 확대와 부채 관리가 가능한 수준에서의 추가 기준금리 인하가 필요하다”(성태윤 연세대 교수) “당장 1분기 소비절벽을 막기 위해 정부의 기존 대책들 외에도 춘절 기간 중국 관광객을 끌어들일 획기적 유인책이나 설 연휴 기간 소비를 늘릴 대책 등이 시급해 보인다”(이준협 현대경제연구원 경제동향분석실장) 등의 주문이 나오지만, 효과가 길지 않은 단기 처방이거나 부작용이 수반되는 것들이다.
그 보다는 긴 안목에서의 중장기 대책을 주문하는 목소리가 크긴 하지만, 이 또한 지극히 교과서적인 데다 당장 성과를 기대할 수 없다는 점에서 상당한 인내심이 필요해 보인다. 이종우 IBK투자증권 리서치센터장은 “장기 성장세 회복은 결국 시간은 걸리지만, 경제의 내공을 높이는 체질개선”이라며 “여성의 경제활동참여, 이민ㆍ북한인력 활용 등으로 노동력을 유지하고 자본투자를 지속적으로 독려하는 한편, 우선은 적극적인 연구개발로 기술 혁신을 이루는 게 정답”이라고 말했다.
0 개 댓글