업무경험

Machine Learning Cell, Intelligent Platform, SK 텔레콤, (2017.01 ~)

현재 machine learning 및 deep learning을 현업에 원활히 적용하기 위한 machine learning platform을 개발하고 있습니다.
  • AutoML 개발, (2017.09 ~)
    • 분석가 외에 현업 담당자들도 deep leanring을 분석에 활용할 수 있도록 노력하고 있습니다. 현업 담당자 향 서비스를 지향합니다.
    • Keras를 사용해서 Genetic Algorithm을 바탕으로 한 NAS 및 mxnet을 활용, Relation Network를 통해 AutoML을 구현하였습니다.
  • 업무 자동화 project 진행, (2017. 01 ~ 2017. 12)
    • Modeling 자동화를 통해 업무 효율화를 이끌어낸 경험이 있습니다.
  • Deep learning 관련 기술 sensing, (2016. 06 ~)
    • 팀 동료들과 함께 structural data를 embedding하여 업무에 훌륭하게 적용하고 있습니다.
    • VAE와 GAN 등 generative model에 관심을 가지고 공부하고 있습니다.
    • 자연어 처리에 대해서도 관심이 많고 업무에 어떻게 적용할지 고민하고 있습니다.
    • Relation network와 Attention mechanism이 여러분야에서 유용하게 사용되고 있어 여러가지 구현체를 만들어 가고 있습니다.
    • 최근에는 Few-shot learning을 공부하고 있습니다.
    • Blog를 통해 최근에 습득한 내용들 위주로 정리하고 있습니다. 앞으로는 통계적인 내용부터 ML/DL을 아우르는 post를 작성하는 것이 목표입니다. 다음을 참고하세요.

Data Insight team, Data Science Center, SK 텔레콤, (2016. 06 ~ 2016. 12)

Data 분석가로 현업과의 communication을 통해 data 분석 결과를 business에 적용하였습니다.
  • 대상 고객군 타게팅, (2016. 06 ~ 2016. 12)
    • 가장 기본적인 업무로 다수 경험이 있습니다.

삼성화재 자동차 상품파트, (2013. 01 ~ 2016. 05)

자동차 보험료 산출을 위한 거의 모든 영역에서 경험을 쌓았습니다. 보험료 신고는 거의 해본 적이 없습니다. 그러니깐, 요율 당국과 communication을 하거나 협의를 하는 요율 전문가는 아니었구요. 데이터 분석 전문가로서 역할을 했습니다. 하지만, 자동차 보험은 데이터 분석이 8할이라는 생각을 강하게 가지고 있습니다. 업무하는 동안 거의 아무도 하지 않는 보험업계에서는 아직 도입되지 않은 보험 선진국 기법들을 많이 적용해 봤습니다. 아주 오래전 일이지만, 보험개발원에 조언을 해준 적은 있습니다.
  • 보험료 계산 엔진 제작, (2014. 01 ~ 2014. 10)
    • 타사 보험료 비교를 위한 가격 scrolling 및 타사 보험료 계산 엔진 제작
    • 분석을 위한 다양한 삼성화재 보험료 엔진 제작
  • 가격 최적화, (2015. 01 ~ 2016. 05)
    • 순보험료 모형과 갱신율 모형을 바탕으로 최적 요율 시나리오 비교 분석
  • 데이터 시각화, (2015. 06 ~ 2016. 05)
    • Tableau를 이용한 데이터 시각화
    • 지역별 summary data와 함께 모형 결과물로써 도출된 갱신율/순보험료 등 정보를 시각화
  • 해외 유수 보험사의 benchmark 및 협업 전담 추진, (2013. 01 ~ 2016. 05)
    • Allstate, Geico, Progressive, R&SA 등 유수 보험사의 요율 관련 Best practice에 대한 benchmark를 진행했습니다.

삼성화재 자동차 보험 혁신 TF, (2011. 06 ~ 2012. 12)

보수적인 업계 문화 속에서 아직 도입되지 않은 요율 paradigm인 GLM을 업무에 녹이려 노력했습니다. 현재 Chubb사에서 동남아지역 일반보험에 vice president로 계신 Taikuan Ly와 함께 신요율에 대해서 많이 공부하고 배울 수 있었습니다.
  • 보험료 모델링, (2011. 06 ~ 2016. 05)
    • GLM을 이용한 순보험 모델링
    • 순보험료법 / 손해율법 비교 분석
  • Retention 모형 제작, (2012. 01 ~ 2016. 05)
    • 신규/타사 및 갱신 모형 제작

Technical Experience

Education

2005-2010
PhD, 통계학; The Pennsylvania State University (University Park, PA, USA) Dissertation title: Functional Data Analysis and its application to sparse longitudinal data
2003-2005
석사, 응용통계학; 연세대학교 (서울, 대한민국)
1996-2003
학사, 경영학 / 응용통계학; 연세대학교 (서울, 대한민국)

Publication

  • Kim, K., Senturk, D., and Li, R. (2009). “The recent history functional linear models,”, Festschrift in honor of Tom Hettmansperger, WSPC edited by David Hunter, Jim Rosenberger, and Donald Richards

  • Kim, K., Senturk, D., and Li, R. (2010). “The recent history functional linear models for sparse longitudinal data,” Statistical Planning and Inference

Blogs

  • 영문: medium.com/@kion.kim
  • 국문/영문: kion.kim@github.io

Posters

  • Poster presentation, The 2009 Rao Prize Conference, PA

  • Poster presentation, Conference on Statistical Method for Complex Data: In Honor of Raymond Carroll, College Station, TX

  • Poster presentation, Nonparametric Statistics and Mixture Models: Past, Present, and Future, University Park, PA

Talks

  • Variational Autoencoder tutorial 강의 진행 (경북대), 201805

  • Data Science, Statistics, Deep Learning 관련 내용 발표 다수 (국민대, 건국대, 경북대, 전남대 등), 201605 ~

  • Topic contributed talk, 2009 Joint Statistical Meeting, Washington D.C.

  • Topic contributed talk, 2008 Joint Statistical Meetings, Denver, CO

Conference 참여

  • Earnix Summit 2015, London, UK

  • Earnix Summit 2014, London, UK

Programming 언어

Python:
최근 2년 동안 가장 많이 사용하고 있는 언어입니다. Deep learning을 바탕으로 대부분의 분석을 python으로 진행하고 있습니다. 현재는 팀 내에서 협업을 통해 분석 framework를 제작하고 있습니다. 개발자들과 함께 일하는 개발과 분석을 동시에 진행하는 중간 영역에서 활동하며, ML Developer 역할을 하고 있습니다.
Java:
약 3년간 보험료 비교 분석 엔진 제작에 주로 사용하였습니다. mybatis를 활용한 동적 query 생성하여 보험료 로직을 구현하였고, swing을 이용하여 GUI까지 구현함으로써, stand alone solution 개발 전 과정을 혼자 진행했습니다. 상당히 안정적인 solution을 만들어서 개인적으로는 탄탄한 경험을 가지고 있다고 생각하지만, 협업 경험은 별로 없었다는 것이 가장 아쉽습니다.
R:
Deep learning을 공부하기 전에 주로 쓰던 분석 도구입니다. 이전 회사에 있을 때에는 데이터가 그렇게 크지 않았기 때문에, R을 이용해서 분석했습니다. PC용 R이면 충분했구요. 하지만, SK 텔레콤에서는 데이터가 너무 큰 관계로, 서버용 R만 사용했습니다. Linux 기반의 R-studio 사용 경험이 있습니다.
Etc:
기타 여러가지 연구용 언어에 대한 사용 경험과 개념을 가지고 있습니다.

언어 및 문화

  • 한국어가 모국어이지만, 영어도 가능합니다. Multi culture에 대한 경험이 있어, 낯선 환경에서도 잘 적응할 수 있습니다.
  • 아직 많지는 않지만, 현재 영어로 Medium blogging을 하고 있습니다.