Monthly Archives: 11월 2015

당장 발등에 떨어진 불이라도 꺼보자!

  1. PRODUCTION SYSTEM
    1. 설명에 앞서서 ‘추론엔진’이란?
      1. 위키백과(https://ko.wikipedia.org/wiki/%EC%B6%94%EB%A1%A0_%EC%97%94%EC%A7%84)
      2. 위 링크에는 다음처럼 되어있다.
        1. 지식기반을 통해 추론행위를 함으로써 주어진 규칙과 사실을 이용하여 새로운 사실을 탐색하는 행위를 하는 전문적인 프로그램을 말한다. 지식획득을 용이하게 하는 형태로 표현해야 하며 저장이 간단해야 하고, 표현이 정확해야 한다. 또한 여러 가지 표현방식을 가지고 있어야 한다.
    2. ‘추론엔진’은 몇 가지만 알면 만들어 볼 수 있다. 아래는 그 몇 가지를 설명한다.
  2.  몇 가지!!!!!!
    1. 추론엔진은 쉽게는 다음처럼 설명할 수 있다.
      1. 무의미한 DATA를 모아 KNOWLEDGE을 만들고, 이 KNOWLEDGE을 네트워크NETWORK로 묶어 기존의 DATA에 없는 새로운 KNOWLEDGE 만들어 낸다.
    2. 여기서..
      1.  DATA는?
        1. DATA와 DATA간 연결고리가 없는 RAW DATA를 의미한다. 가장 밑 바닥의 그야말로 자료를 의미한다.
      2. KNOWLEDGE는?
        1. DATA와 DATA간 관계가 형성이 되어 있는 것을 말한다.
      3. KNOWLEDGE는 DATA에 관계를 추가한 것으로 이해하면 된다.
    3. SEMANTIC NETWORK는?
      • KNOWLEDGE와 같은 원리로 KNOWLEDGE과 KNOWLEDGE이 서로 연결된 것을 말한다.
      • KNOWLEDGE는 LINK를 가지고 있고, LINK는 의미를 가질 수 있고, 또한 LINK는 방향을 가질 수 있다.
      • SEMANTIC NETWORK을 이용하면 추론엔진을 쉽게 만들 수 있다.
      • 그림의 예)
      • sn
    4. SEMANTIC NETWORK은 KNOWLEDGE가 연결된 것이고, KNOWLEDGE는 DATA를 기반으로 만들어진다.  여기에서 KNOWLEDGE와 DATA를 일정한 규칙에 통해 KNOWLEDGE로 변형하는 방법이 있는데 이것이 FRAME이다.
    5. FRAME란?
      frame

      1. 어떤 개념과 관련된 지식을 하나의 덩어리로 다루기 위한 KNOWLEDGE의 표현 방법이다.
    6. 그런데….
      1. DATA에서 KNOWLEDGE를 추출.가공할 때 TEXT의 표현 자유도가 너무 높아서 대부분은 배가 산으로 가 버린다.
      2. 따라서, 어느 정도의 규격화된 지식 추출, 가공 방법이 필요한데 이것이 PRODUCTION RULE이다.
      3. PRODUCTION RULE은 KNOWLEDGE를 아래 처럼 표현하는 것이다.
        1. IF P THEN Q
        2. IP P AND Q THEN R
        3. IP Y THEN Z
        4. Production Rule 예)pr
    7. PRODUCTION RULE을 이용하여 주어진 질문에 답을 구하는 것이 INFERENCE다.
    8. 몇 가지만 알면 추론 엔진을 만들 수 있다. 다시 한번 정리하면 아래와 같다.
      1. FRAME를 통해서 DATA를 가공해 KNOWLEDGE을 만들어 낸다.
      2. KNOWLEDGE 끼리 서로 연결하여 SEMANTIC NETWORK을 구성한다.
      3. SEMANTIC NETWORK을 이용하여 질문에 대한 답을 구한다.  이것이 추론이다.
  3. 마지막으로….
    1. 앞 모든 과정을 이해하면 Production System을 만들 수 있다.
    2. 인공지능의 백미, 추론 시스템은 이러한 과정을 통해 만들어진다.
    3. 하지만,  실제 구현에 있어시는 KNOWLEDGE 생성 쪽에서 대부분 실패한다.  TEXT 의 자유도가 너무나 높으며, 이를 적절히 가공할 수 있는 RULE MAKER가 없기 때문이다.
    4. 만일!!!! 이미 잘 가공된 KNOWLEGE가 있거나 또는 예상된다면, 그래서 SEMANTIC NETWORK를 만들어 낼 수 있다면 제한된 DOMAIN에서는 멋진 추론 엔진을 만들 수 있을 것으로 예상된다.
  4. 다음 번 글 올릴 때는 실제로 만든 추론엔진의 데모를 기대하면서….. 끝!!

서비스 리뷰 – 영화 추천 큐레이션 서비스 ‘왓챠'(watcha)

‘오늘 영화 뭐 볼까?’의 고민을 해결 할 개인화된 영화 추천 서비스 왓챠에 대해 알아볼까 합니다. 

Summary

  • 별점 평가를 기반으로 한 영화 추천 큐레이션 서비스(개인화 추천 서비스 제공)
  • 예상 별점 신뢰도를 인정받아 구글 코리아와 제휴를 맺고 구글 영화 검색에 별점 자료를 제공 중 (2014년 기준 별점 평가 1억 개 돌파)
  • 자체 수익성 모델이 없어, 타사 VOD 서비스 및 다른 서비스와의 연계를 통한 수익 창출 구조

 

홈페이지 접근방식은 로그인을 통해서만 메인 페이지에 접속이 가능 하며, 가입 후 별점 평가 기본 20개를 입력 해야 추천이 가능합니다.

      image2015-7-14 14-10-22 (1)

 

서비스 분석 

  1. 박스오피스(일반추천) – 영화 랭킹, 누적 관객 수 그래프 제공, 다양한 영화 리스트를 통해 콘텐츠를 추천
  2. 평가 늘리기(취향분석을 위한 추천) – 사용자의 취향분석을 위해 다양한 콘텐츠를 제공그림1.png
  3. 개인 추천을 위한 취향 분석결과 – 사용자가 입력한 영화별 별점 정보를 분석하여 통계 추천, 개인별 페이지를 제공
    • 마이페이지>영화보관함>취향통계분석
    • 제공하는 정보 : 별점 분포, 선호 장르, 선호 국가, 선호 배우, 선호 감독, 선호 키워드
  4. 개인추천(필터기능) – 대분류 메뉴마다 영화 필터 제공 그림2
  5. 추천 방식 
    • 일반 추천, 개인 추천으로 구성되어 있으나 개인 추천의 비중이 더 큼
    • 일반 추천 방식은 박스오피스 메뉴, 개인 추천 방식은 사용자가 입력한 별점 정보를 바탕으로 취향을 분석하여 다양한 콘텐츠를 제공
    • 페이지를 구성하는 모든 영화에 나의 예상 별점이 제공 됨
    • 사용자가 원하는 조건으로 필터링하여 최종 콘텐츠 페이지를 구성
    • 취향 분석 결과에 따라 공통되는 감독, 배우 또는 비슷한 영화들을 반영하여 추천
  6. 최종콘텐츠 정보
    • 기본정보 : 줄거리, 배우, 감독, 포스터, 장르, 제작년도, 관람등급, 러닝타임, 예고편 등 제공 
    • 코멘트 : 스포일러의 가능성이 있는 멘트들은 자동으로 블라인드 처리, 페이스북과 연동된 경우 친구들의 코멘트, 별점정보등을 제공
    • 관련 뉴스 제공 : 영화 관련 뉴스를 제공
    • 비슷한 영화 추천 : 선택한 영화와 비슷한 장르의 영화를 추천
    • 감상 가능 서비스 : 선택한 콘텐츠를 볼 수 있는 감상 서비스 제공, 사용자는 VOD의 가격과 화질을 비교하여 선택할 수 있고 클릭하면 해당 서비스로 연결을 제공
  7. 추천결과

그림3

 

서비스 특징

  • 입력한 별점 평가가 많을수록 추천 콘텐츠 매칭율의 신뢰도 상승
  • 개인의 취향을 반영한 실시간 추천
  • 추천 받은 영화를 감상할 수 있는 VOD 서비스와 연계
  • 문화 리뷰 추천서비스로의 도약을 목표, 콘텐츠 영역 확장(드라마, 도서)
  • 최근 UI변경으로 콘텐츠 영역이 확장되면서 SNS 정보 교류 중심으로 개편, 개인 추천 서비스의 본질이 흐려짐

 

 

개인의 성향을 분석하여 취향에 맞는 영화를 추천해주는 서비스 목적에 충실, 다양한 콘텐츠를 접할 수 있는 기회를 제공하며 최근 서비스 업그레이드를 진행하여 영화 앱에서 문화앱으로의 도약을 꿈꾸고 있는 왓챠입니다.

KTH ‘DAISY’ 활용한 KT SKYLIFE의 세계 최초 실시간 채널 종량제 광고 시스템 출시

KTH ‘DAISY’ 활용한 KT SKYLIFE의 세계 최초 실시간 채널 종량제 광고 시스템 출시
-실시간 분석 처리 기술 활용한 초단위 광고 정산 시스템 ‘ARA’

KTH 빅데이터 솔루션 ‘DAISY’의 실시간 분석 처리 기술력을 활용한 실시간 채널 종량제 광고 시스템 ‘ARA(Advanced Realtime Advertising)’가 출시 되었습니다. (관련 기사)

ARA는 정확한 광고 시청 정보를 산출하고, 이를 기반으로 투명한 거래체계를 구축하기 위한 시스템으로

실시간 초단위 시청률 분석 엔진을 적용하여 시청률 전수조사의 정확성과 신뢰성 향상, 타겟 노출도 강화, 객관적 광고비 효율성 및 광고 효과 분석을 제공합니다.

 

그림2

 

‘DAISY’가 핵심기술로 적용된 초단위 방송광고 시스템이 스마트미디어의 홍수 속에서 방송 광고를 부흥시킬 새로운 패러다임으로 업계의 주목을 받고 있습니다.

앞으로도 Realtime  No.1 Analytics Solution이 되도록 더욱 노력하겠습니다.