Technology

Workshop:GCPUG Taipei Kubernetes Workshop

Other

講座:人人都該懂的數據思維課 - 木木卡工作室

Slide: https://storage.googleapis.com/s.momoka.tw/人人都該懂的數據思維課.pdf

  • 拉資料,做報表(定義範疇),算命
  • 讓更多人接觸到資料,看到需要看的資料
  • 無法知道:粉絲會在哪出沒、使用者年收入多少、數據真實性
  • 了解現況、找出著力點、擬定策略、觀察成效
  • 即時監控
  • 數據思維
  • 憑感覺 v.s. 看數據
  • 數據分析不是大數據
  1. 檢查
  • 與現實世界的正確性:人事時地物
  • 是否有闕漏
  • 欄位特性:違反特性的資料
  • 分布方式
  1. 來源
  • 各頻道撥出特定候選人時間比例
    • 電腦辨識?工人智慧統計?電視台提供?
  • 抽樣
    • 課程滿意度調查,是否有提供誘因
    • 通常餐廳難吃才會去評價
  1. 定義
  • 出席率計算方式:有出現就算?待超過半場才算?沒有遲到早退才算?
  • 營收:每個部門要的數字定義不一樣,營業額、毛利、淨利?
  • 電商轉換率:起點和終點分別是?訂單建立 or 完成付款(信用卡?ATM?)
  • 觀展人數/人次、影片觀看次數
  1. 脈絡
  • 使用者跟你想的不一樣
  • 安裝停車位 App 的人不一定是駕駛,可能是附駕駛
  • 沒被追蹤到的數據,例如使用非官方渠道而沒被追蹤到
  • 蝦皮免運搬家:同一組買賣家
  1. 拆解
  • 找出害群之馬
  • App 下載->註冊率
    • 下載時段不同註冊率不同->買廣告時段
    • 裝置差異
    • 使用者來源:平台、文案
  • 離職率
    • 到職多久? 3 個月、1 年、3 年以上?
  1. 放大鏡
  • 針對一群人觀查
  • Cohort
  1. 因果
  • 該如何把使用者找回來
  • EX: 留言超過 5 則的,訂閱率上升。加入 LINE 群組的使用者對訂閱率的影響
  • Magic Moment
    • 新用戶註冊後 10 天內新增 7 個好友,留存率特別高
  • 陷阱:中間可能藏其他未知的關聯、變數,或根本完全運氣好
  • 統計學內,關聯和因果的不同
  1. 指標
  • Cost Per Registration (CPR)
  • 假流量的過濾
  • 思考:不同數據結果到底需不需要一致?
  • 看趨勢變化而非絕對數字
  • GA 的 User、Session、Paveview
  • 抽樣偏誤:是否提供誘因,前後變數是否一致
  1. 比較
  • 跟自己比
  • 跟別人比
  • 沒辦法比較?那就沒意義啊!
  1. 慢即是快
  • 經驗導向
  • 錯誤的資料可能導致錯誤決策
  • 避免產出錯誤資料,數據量大通常無法人工驗證正確性