91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

埋點實踐過程中遇到的一些問題

數(shù)據(jù)分析與開發(fā) ? 來源:一個數(shù)據(jù)人的自留地 ? 作者:數(shù)據(jù)人創(chuàng)作者聯(lián)盟 ? 2021-10-22 16:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

埋點本身現(xiàn)在已經(jīng)有太多的集成解決方案,神策、諸葛IO、GIO,但是在實踐的過程中仍然還是會碰都很多問題,這些問題都是躺過的坑。

01

梳理當前業(yè)務(wù),未來業(yè)務(wù)發(fā)展問題,目的是給埋點預(yù)留空間

① 業(yè)務(wù)兼容的問題

前期規(guī)范執(zhí)行之后,后續(xù)隨著業(yè)務(wù)的拓展,已有數(shù)據(jù)字段滿足不了業(yè)務(wù)的分析需求;

② 產(chǎn)品兼容的問題

埋點從應(yīng)用端來區(qū)分,web/ios/android,小程序,公眾號,然后還要區(qū)分一下是否是原生,還是H5,新老版本之間肯定會帶來一些模塊化的差異;

③ 前后端埋點不一致的問題

前端請求服務(wù)端的數(shù)據(jù)大多是存在binlog里面的,數(shù)據(jù)日志同步解析的過程里面可能會存在丟包的可能性,數(shù)倉的穩(wěn)定性也會影響數(shù)據(jù)質(zhì)量;后端服務(wù)信息存儲的數(shù)據(jù)是存在mysql,表字段結(jié)構(gòu)化,分多表存儲,需要靠主鍵進行關(guān)聯(lián),有大量的ETL過程。兩者之間可能因為數(shù)據(jù)清洗、處理、實時技術(shù)等原因,造成數(shù)據(jù)差異化;

③ 自埋點和第三方應(yīng)用統(tǒng)計口徑的問題

自埋點一般都會定義一個唯一id作為區(qū)分用戶的標志,但是第三方是缺少用戶屬性信息的判斷,一般會以設(shè)備號uuid/imse,或者IP地址段、mac地址段作為區(qū)分標志,從而造成統(tǒng)計數(shù)據(jù)上的差異化,對于留存分析、轉(zhuǎn)化分析、流失分析需要用到明細數(shù)據(jù)的場景,可兼容性不是很友好;

④ 埋點開發(fā)技術(shù)執(zhí)行不到位的問題

絕大多數(shù)情況下我們說埋點,一般都是說前端埋點,前端開發(fā)工程師在做埋點的時候又多是人為埋點,在開發(fā)過程中,會造成部分信息冗余、重復(fù)、記錄不完整的情況存在;

⑤ 多產(chǎn)品之間的模塊差異化問題

埋點不能夠只有一套標準規(guī)范,多生態(tài)應(yīng)用下,業(yè)務(wù)繁瑣,在產(chǎn)品、技術(shù)的架構(gòu)上有明顯的差異,不同的產(chǎn)品、模塊、坑位、點擊事件的定義也可能有一定的區(qū)別,這時候可能需要根據(jù)場景劃分不同的埋點標準;

⑥ 自定義埋點信息的鍵對設(shè)計問題

往往會在埋點里面增加一個json的字段(bdata),在埋點的時候?qū)懭胱远x的業(yè)務(wù)信息進行場景識別,譬如活動id、業(yè)務(wù)信息、用戶快照的基本信息等,不同開發(fā)寫入的自定義字段格式可能會有差異;

02

埋點應(yīng)用場景,對應(yīng)初期埋點預(yù)留

基于業(yè)務(wù)分析框架,梳理常規(guī)分析案例中需要用到的埋點數(shù)據(jù)集,核心指標必須要有埋點;

基于算法模型框架,梳理算法所需要構(gòu)建的數(shù)據(jù)特征需要用到的字段信息;

基于業(yè)務(wù)訴求,梳理非常規(guī),當前沒需求未來有應(yīng)用場景的字段信息;

舉個例子,譬如供需匹配、資源調(diào)度、智能選址,所對應(yīng)的幾個信息主體分別是:用戶需求方、用戶供給方、商品信息、時間信息、空間信息、行為信息、業(yè)務(wù)信息;

03

標簽預(yù)留場景,反推埋點預(yù)留

基于用戶畫像的標簽建設(shè),需要考慮畫像的多層屬性,社會屬性、基本屬性、市場屬性、交易屬性、行為屬性等,通過畫像篩選人群的時候,可能需要通過數(shù)據(jù)模型建立用戶分層的過程,所需要用到的輔助數(shù)據(jù);

基于智能運營的標簽建設(shè),運營策略、活動、方案的數(shù)據(jù)需求收集,哪些標簽需要用到埋點中的信息;

基于營銷系統(tǒng)的標簽建設(shè),涉及到渠道分配、廣告投放、點擊預(yù)測等,可能需要對曝光、點擊、轉(zhuǎn)化進行全鏈路的埋點建設(shè),或者基于某一個產(chǎn)品使用鏈路,埋點數(shù)據(jù)要完備;

標簽管理,沒有一套產(chǎn)品來支撐,多標簽?zāi)阍趺磳ν馓峁?;海量的標簽,又要怎么做標簽管理?/p>

04

后面做推薦抓到核心指標,前期做埋點預(yù)設(shè)

推薦算法中需要用到的數(shù)據(jù)特征中包含哪些數(shù)據(jù)指標,其中埋點的部分所需要的數(shù)據(jù)格式是怎樣的;

推薦算法的設(shè)計方案,基于用戶、基于物品、協(xié)同過濾、基于規(guī)則、基于融合模型,不同的方案下,對數(shù)據(jù)底層的要求可能也會有一定的差異;

05

數(shù)倉庫表的開發(fā)成本

埋點數(shù)據(jù)落到數(shù)倉后,需要預(yù)先建立哪些表,如何做埋點數(shù)據(jù)的分層;

畢竟埋點的數(shù)據(jù)體量是非常大的,TB級數(shù)據(jù)的存儲本身就是一個比較大的成本,再加上調(diào)度系統(tǒng)、計算資源、運行性能等方面,就需要數(shù)倉團隊在一開始就要把數(shù)據(jù)模型提前建立好,做好ods層到dw層、ads層的劃分,維度和事實之間的建設(shè);

06

數(shù)倉性能,時間問題(hive)

因為埋點數(shù)據(jù)的體量問題,落表的時候,一定會存在大量的冗余字段,如果集群資源比較緊張,對于常規(guī)數(shù)據(jù)的統(tǒng)計、計算都會帶來性能上的問題;

在數(shù)據(jù)團隊的架構(gòu)中,有對外提供數(shù)據(jù)應(yīng)用服務(wù),對于數(shù)據(jù)的實時計算就有一定的要求,什么場景下應(yīng)該是T+1,什么場景下應(yīng)該是偽實時,避免數(shù)據(jù)調(diào)度任務(wù)影響前臺應(yīng)用產(chǎn)出;

07

產(chǎn)品全埋點還是分塊埋點?分塊兒埋點的話有什么響應(yīng)機制?應(yīng)用措施?

全埋點和分模塊埋點,直接的影響是數(shù)據(jù)存儲成本的問題,作為一個數(shù)據(jù)分析,這也是不得不考慮的問題,如果數(shù)據(jù)結(jié)構(gòu)優(yōu)化不做好,每年浪費的存儲成本可能會是百萬級的消耗。隨著周期的增加,成本浪費會更嚴重。

所以說,企業(yè)數(shù)據(jù)的分析,不僅局限在數(shù)據(jù)本身,而應(yīng)該是全面的剖析,多場景的結(jié)合。凡事都不簡單,如果簡單為什么那么多人都沒有做成功,只不過是層次還到而已。

- EOF -

推薦閱讀 點擊標題可跳轉(zhuǎn)

1、萬字長文說透分布式鎖

2、pandas 與 GUI 界面的超強結(jié)合,爆贊!

3、面試,MySQL 搞透這 20 道就穩(wěn)了

看完本文有收獲?請轉(zhuǎn)發(fā)分享給更多人

推薦關(guān)注「數(shù)據(jù)分析與開發(fā)」,提升數(shù)據(jù)技能

點贊和在看就是最大的支持

原文標題:干貨分享:埋點實踐過程中碰到的坑點集合

文章出處:【微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

埋點本身現(xiàn)在已經(jīng)有太多的集成解決方案,神策、諸葛IO、GIO,但是在實踐的過程中仍然還是會碰都很多問題,這些問題都是躺過的坑。

01

梳理當前業(yè)務(wù),未來業(yè)務(wù)發(fā)展問題,目的是給埋點預(yù)留空間

① 業(yè)務(wù)兼容的問題

前期規(guī)范執(zhí)行之后,后續(xù)隨著業(yè)務(wù)的拓展,已有數(shù)據(jù)字段滿足不了業(yè)務(wù)的分析需求;

② 產(chǎn)品兼容的問題

埋點從應(yīng)用端來區(qū)分,web/ios/android,小程序,公眾號,然后還要區(qū)分一下是否是原生,還是H5,新老版本之間肯定會帶來一些模塊化的差異;

③ 前后端埋點不一致的問題

前端請求服務(wù)端的數(shù)據(jù)大多是存在binlog里面的,數(shù)據(jù)日志同步解析的過程里面可能會存在丟包的可能性,數(shù)倉的穩(wěn)定性也會影響數(shù)據(jù)質(zhì)量;后端服務(wù)信息存儲的數(shù)據(jù)是存在mysql,表字段結(jié)構(gòu)化,分多表存儲,需要靠主鍵進行關(guān)聯(lián),有大量的ETL過程。兩者之間可能因為數(shù)據(jù)清洗、處理、實時技術(shù)等原因,造成數(shù)據(jù)差異化;

③ 自埋點和第三方應(yīng)用統(tǒng)計口徑的問題

自埋點一般都會定義一個唯一id作為區(qū)分用戶的標志,但是第三方是缺少用戶屬性信息的判斷,一般會以設(shè)備號uuid/imse,或者IP地址段、mac地址段作為區(qū)分標志,從而造成統(tǒng)計數(shù)據(jù)上的差異化,對于留存分析、轉(zhuǎn)化分析、流失分析需要用到明細數(shù)據(jù)的場景,可兼容性不是很友好;

④ 埋點開發(fā)技術(shù)執(zhí)行不到位的問題

絕大多數(shù)情況下我們說埋點,一般都是說前端埋點,前端開發(fā)工程師在做埋點的時候又多是人為埋點,在開發(fā)過程中,會造成部分信息冗余、重復(fù)、記錄不完整的情況存在;

⑤ 多產(chǎn)品之間的模塊差異化問題

埋點不能夠只有一套標準規(guī)范,多生態(tài)應(yīng)用下,業(yè)務(wù)繁瑣,在產(chǎn)品、技術(shù)的架構(gòu)上有明顯的差異,不同的產(chǎn)品、模塊、坑位、點擊事件的定義也可能有一定的區(qū)別,這時候可能需要根據(jù)場景劃分不同的埋點標準;

⑥ 自定義埋點信息的鍵對設(shè)計問題

往往會在埋點里面增加一個json的字段(bdata),在埋點的時候?qū)懭胱远x的業(yè)務(wù)信息進行場景識別,譬如活動id、業(yè)務(wù)信息、用戶快照的基本信息等,不同開發(fā)寫入的自定義字段格式可能會有差異;

02

埋點應(yīng)用場景,對應(yīng)初期埋點預(yù)留

基于業(yè)務(wù)分析框架,梳理常規(guī)分析案例中需要用到的埋點數(shù)據(jù)集,核心指標必須要有埋點;

基于算法模型框架,梳理算法所需要構(gòu)建的數(shù)據(jù)特征需要用到的字段信息;

基于業(yè)務(wù)訴求,梳理非常規(guī),當前沒需求未來有應(yīng)用場景的字段信息;

舉個例子,譬如供需匹配、資源調(diào)度、智能選址,所對應(yīng)的幾個信息主體分別是:用戶需求方、用戶供給方、商品信息、時間信息、空間信息、行為信息、業(yè)務(wù)信息;

03

標簽預(yù)留場景,反推埋點預(yù)留

基于用戶畫像的標簽建設(shè),需要考慮畫像的多層屬性,社會屬性、基本屬性、市場屬性、交易屬性、行為屬性等,通過畫像篩選人群的時候,可能需要通過數(shù)據(jù)模型建立用戶分層的過程,所需要用到的輔助數(shù)據(jù);

基于智能運營的標簽建設(shè),運營策略、活動、方案的數(shù)據(jù)需求收集,哪些標簽需要用到埋點中的信息;

基于營銷系統(tǒng)的標簽建設(shè),涉及到渠道分配、廣告投放、點擊預(yù)測等,可能需要對曝光、點擊、轉(zhuǎn)化進行全鏈路的埋點建設(shè),或者基于某一個產(chǎn)品使用鏈路,埋點數(shù)據(jù)要完備;

標簽管理,沒有一套產(chǎn)品來支撐,多標簽?zāi)阍趺磳ν馓峁?;海量的標簽,又要怎么做標簽管理?/p>

04

后面做推薦抓到核心指標,前期做埋點預(yù)設(shè)

推薦算法中需要用到的數(shù)據(jù)特征中包含哪些數(shù)據(jù)指標,其中埋點的部分所需要的數(shù)據(jù)格式是怎樣的;

推薦算法的設(shè)計方案,基于用戶、基于物品、協(xié)同過濾、基于規(guī)則、基于融合模型,不同的方案下,對數(shù)據(jù)底層的要求可能也會有一定的差異;

05

數(shù)倉庫表的開發(fā)成本

埋點數(shù)據(jù)落到數(shù)倉后,需要預(yù)先建立哪些表,如何做埋點數(shù)據(jù)的分層;

畢竟埋點的數(shù)據(jù)體量是非常大的,TB級數(shù)據(jù)的存儲本身就是一個比較大的成本,再加上調(diào)度系統(tǒng)、計算資源、運行性能等方面,就需要數(shù)倉團隊在一開始就要把數(shù)據(jù)模型提前建立好,做好ods層到dw層、ads層的劃分,維度和事實之間的建設(shè);

06

數(shù)倉性能,時間問題(hive)

因為埋點數(shù)據(jù)的體量問題,落表的時候,一定會存在大量的冗余字段,如果集群資源比較緊張,對于常規(guī)數(shù)據(jù)的統(tǒng)計、計算都會帶來性能上的問題;

在數(shù)據(jù)團隊的架構(gòu)中,有對外提供數(shù)據(jù)應(yīng)用服務(wù),對于數(shù)據(jù)的實時計算就有一定的要求,什么場景下應(yīng)該是T+1,什么場景下應(yīng)該是偽實時,避免數(shù)據(jù)調(diào)度任務(wù)影響前臺應(yīng)用產(chǎn)出;

07

產(chǎn)品全埋點還是分塊埋點?分塊兒埋點的話有什么響應(yīng)機制?應(yīng)用措施?

全埋點和分模塊埋點,直接的影響是數(shù)據(jù)存儲成本的問題,作為一個數(shù)據(jù)分析,這也是不得不考慮的問題,如果數(shù)據(jù)結(jié)構(gòu)優(yōu)化不做好,每年浪費的存儲成本可能會是百萬級的消耗。隨著周期的增加,成本浪費會更嚴重。

所以說,企業(yè)數(shù)據(jù)的分析,不僅局限在數(shù)據(jù)本身,而應(yīng)該是全面的剖析,多場景的結(jié)合。凡事都不簡單,如果簡單為什么那么多人都沒有做成功,只不過是層次還到而已。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7335

    瀏覽量

    94776

原文標題:干貨分享:埋點實踐過程中碰到的坑點集合

文章出處:【微信號:DBDevs,微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    在并聯(lián)使用MOS存在一些問題,要怎樣做才能避免這些問題?

    在并聯(lián)使用MOS存在一些問題,那我們要怎樣做才能避免這些問題? 首先,器件的致性定要好。 在功率MOSFET多管并聯(lián)時,器件內(nèi)部參數(shù)的微小差異就會引起并聯(lián)各支路電流的不平衡而導(dǎo)致單管過流損壞。 其次是功率。如果功率高于25%
    發(fā)表于 12-10 08:19

    關(guān)于六類網(wǎng)線一些問題的解答

    今天我們就圍繞網(wǎng)友一些常見的關(guān)于六類網(wǎng)線的問題進行下匯總式解答: 問 六類網(wǎng)線可以當電源用嗎? 答 六類網(wǎng)線并不是設(shè)計用于傳輸電力的電纜,因此般不建議將其用于電源傳輸。 盡管六類網(wǎng)線的線芯可以
    的頭像 發(fā)表于 12-09 11:13 ?563次閱讀

    程序加載過程中遇到的問題及其解決方法

    。重新啟動Nuclei Studio,該問題解決。 (2)遇到的問題2:下載程序顯示未連接到開發(fā)板,報錯界面如下圖所示。 解決方法:在配套文檔,只要求安裝
    發(fā)表于 10-30 07:59

    對浮點指令擴展中一些問題的解決與分享

    出現(xiàn)無法寫的情況。 結(jié)論 以上就是我們組在擴展浮點指令中出現(xiàn)的一些問題,這些問題總體上歸結(jié)于對蜂鳥的代碼沒有整體性的把握,對內(nèi)容的掌握程度還不夠。在后續(xù)的工作應(yīng)注意理清功能的整體架構(gòu)而對所有的相關(guān)部分進行修改。
    發(fā)表于 10-24 11:47

    極海MCU的ISP和IAP中程序跳轉(zhuǎn)運行問題分析

    最近在調(diào)試程序的程序升級方式,遇到了不少的問題,本篇筆記記錄遇到一些問題及在這個過程中一些問題
    的頭像 發(fā)表于 10-10 14:31 ?3520次閱讀
    極海MCU的ISP和IAP中程序跳轉(zhuǎn)運行問題分析

    靜力水準儀在測量過程中遇到誤差如何處理?

    靜力水準儀在測量過程中遇到誤差如何處理?靜力水準儀在工程沉降監(jiān)測中出現(xiàn)數(shù)據(jù)偏差時,需采取系統(tǒng)性處理措施。根據(jù)實際工況,誤差主要源于環(huán)境干擾、設(shè)備狀態(tài)、安裝缺陷及操作不當四類因素,需針對性解決。靜力
    的頭像 發(fā)表于 08-14 13:01 ?870次閱讀
    靜力水準儀在測量<b class='flag-5'>過程中</b><b class='flag-5'>遇到</b>誤差如何處理?

    求助,關(guān)于TC387使能以及配置SOTA 中一些問題求解

    你好, 之前我拿到貴司給個demo,里面有一些使能以及配置SWAP的代碼, 這里有些疑問 問題1. 判斷SOTA功能是否生效,demo中使用的是 SCU_STMEM1的bit位, 代碼如下
    發(fā)表于 08-08 07:31

    通過SEGGER JLINK調(diào)試CYUSB3014-BZXI遇到的問題求解

    最新版本)。 我按照《 EZ-USB? Suite 用戶指南》第 3 節(jié)“使用 Segger J-Link 進行調(diào)試”進行調(diào)試配置 然而我在調(diào)試過程中遇到一些問題 1. 運行程序時,它不會在應(yīng)用程序線程
    發(fā)表于 07-16 08:27

    在低功耗藍牙產(chǎn)品開發(fā)的過程中,會涉及到一些參數(shù)的選擇和設(shè)定,這些參數(shù)是什么意思,該如何設(shè)定呢?(藍牙廣播)

    在低功耗藍牙產(chǎn)品開發(fā)的過程中,會涉及到一些參數(shù)的選擇和設(shè)定,這些參數(shù)是什么意思,該如何設(shè)定呢?在此介紹一些: 藍牙的廣播類型(Advertising Type) 可連接廣播(ADV_IND):允許
    發(fā)表于 06-25 18:25

    固定式測斜儀在測量過程中遇到誤差如何處理?

    在巖土工程與結(jié)構(gòu)物安全監(jiān)測,固定式測斜儀是捕捉位移變化的核心設(shè)備。然而,實際應(yīng)用可能因環(huán)境、操作或設(shè)備因素導(dǎo)致測量誤差。很多人想要了解固定式測斜儀在測量過程中遇到誤差如何處理?下面
    的頭像 發(fā)表于 06-13 12:10 ?654次閱讀
    固定式測斜儀在測量<b class='flag-5'>過程中</b><b class='flag-5'>遇到</b>誤差如何處理?

    在FX2LP USB上配置GPIF中斷時遇到一些問題,求解決

    你好,我在 FX2LP USB 上配置 GPIF 中斷時遇到一些問題。 我啟用了 INT4 中斷并從 GPIF 中選擇了源 INT4,然后啟用了 GPIF 完成中斷,但我看不到中斷 4 工作。 我該如何做呢?
    發(fā)表于 05-06 08:00

    調(diào)試ADPD188芯片的過程中用I2C調(diào)試過程出現(xiàn)一些問題,求解決

    我在調(diào)試ADPD188芯片的過程中用I2C調(diào)試過程出現(xiàn)一些問題,參考官方提供的代碼調(diào)試中發(fā)現(xiàn),初始化過不去,抓取波形發(fā)現(xiàn)芯片型號對不上了,從芯片外觀看ADPD188bi這個芯片,請問是是芯片回的問題還是軟件上需要調(diào)整還是什么原因
    發(fā)表于 04-16 06:57

    使用AD2428時,通過主節(jié)點發(fā)現(xiàn)從節(jié)點的過程中遇到的問題求解

    在使用AD2428時,通過主節(jié)點發(fā)現(xiàn)從節(jié)點的過程中,遇到以下問題: 按照手冊中將0x9寄存器配置成0x1,讀回0x17寄存器的值為0x29,且主節(jié)點未發(fā)現(xiàn)從節(jié)點。 但是當在此基礎(chǔ)上,將0X9寄存器的值配置為0x9(即打開診斷模式),讀回0x17的值為0x18,主節(jié)點可發(fā)現(xiàn)
    發(fā)表于 04-15 07:14

    使用RTD5.0.0的s32k312,C40_Ip擦除pflash存在一些問題求解決

    我正在使用 RTD5.0.0 的 s32k312,C40_Ip擦除 pflash 存在一些問題: Erase block0(0x420000-0x500000) failed
    發(fā)表于 04-11 06:53

    開關(guān)電源設(shè)計過程中主要元件選擇指南(全333頁)

    該書講解了在開關(guān)電源的制作過程中一些關(guān)鍵的選型與參數(shù)計算方法 純分享貼,有需要可以直接下載附件獲取完整資料! (如果內(nèi)容有幫助可以關(guān)注、贊、評論支持下哦~)
    發(fā)表于 03-25 16:34