Technology

-

Workshop:GCPUG Taipei Kubernetes Workshop

Other

-

講座:人人都該懂的數據思維課 - 木木卡工作室

Slide: https://storage.googleapis.com/s.momoka.tw/人人都該懂的數據思維課.pdf

  • 拉資料,做報表(定義範疇),算命
    • 讓更多人接觸到資料,看到需要看的資料
    • 無法知道:粉絲會在哪出沒、使用者年收入多少、數據真實性
  • 了解現況、找出著力點、擬定策略、觀察成效
    • 即時監控
  • 數據思維
    • 憑感覺 v.s. 看數據
    • 數據分析不是大數據
  1. 檢查
    • 與現實世界的正確性:人事時地物
    • 是否有闕漏
    • 欄位特性:違反特性的資料
    • 分布方式
  2. 來源
    • 各頻道撥出特定候選人時間比例
      • 電腦辨識?工人智慧統計?電視台提供?
    • 抽樣
      • 課程滿意度調查,是否有提供誘因
      • 通常餐廳難吃才會去評價
  3. 定義
    • 出席率計算方式:有出現就算?待超過半場才算?沒有遲到早退才算?
    • 營收:每個部門要的數字定義不一樣,營業額、毛利、淨利?
    • 電商轉換率:起點和終點分別是?訂單建立 or 完成付款(信用卡?ATM?)
    • 觀展人數/人次、影片觀看次數
  4. 脈絡
    • 使用者跟你想的不一樣
    • 安裝停車位 App 的人不一定是駕駛,可能是附駕駛
    • 沒被追蹤到的數據,例如使用非官方渠道而沒被追蹤到
    • 蝦皮免運搬家:同一組買賣家
  5. 拆解
    • 找出害群之馬
    • App 下載->註冊率
      • 下載時段不同註冊率不同->買廣告時段
      • 裝置差異
      • 使用者來源:平台、文案
    • 離職率
      • 到職多久? 3 個月、1 年、3 年以上?
  6. 放大鏡
    • 針對一群人觀查
    • Cohort
  7. 因果
    • 該如何把使用者找回來
    • EX: 留言超過 5 則的,訂閱率上升。加入 LINE 群組的使用者對訂閱率的影響
    • Magic Moment
      • 新用戶註冊後 10 天內新增 7 個好友,留存率特別高
    • 陷阱:中間可能藏其他未知的關聯、變數,或根本完全運氣好
    • 統計學內,關聯和因果的不同
  8. 指標
    • Cost Per Registration (CPR)
    • 假流量的過濾
    • 思考:不同數據結果到底需不需要一致?
    • 看趨勢變化而非絕對數字
    • GA 的 User、Session、Paveview
    • 抽樣偏誤:是否提供誘因,前後變數是否一致
  9. 比較
    • 跟自己比
    • 跟別人比
    • 沒辦法比較?那就沒意義啊!
  10. 慢即是快
    • 經驗導向
    • 錯誤的資料可能導致錯誤決策
    • 避免產出錯誤資料,數據量大通常無法人工驗證正確性