首页
编程日记
ChatGpt专题
LINUX学习
Java学习
前端教程
单片机
嵌入式
通信协议
适配器模式
Markdown
.pdf预览
Android bt
决策树
gaussdb
Pyinstaller
cisp考试难度
BH1750
函数替换
断裂力学
插入排序
大学生网页作业
TabBar
地图随机点
回溯
directMemorty
循证研究
离线数仓
2024/4/27 15:33:45
尚硅谷大数据项目《在线教育之离线数仓》笔记007
视频地址:尚硅谷大数据项目《在线教育之离线数仓》_哔哩哔哩_bilibili 目录 第12章 报表数据导出 P112 01、创建数据表 02、修改datax的jar包 03、ads_traffic_stats_by_source.json文件 P113 P114 P115 P116 P117 P118 P119 P120 P121 P122【122_在…
阅读更多...
大数据组件之Hive(Hive学习一篇就够了)
文章目录一、Hive安装1、解压环境2、环境变量配置3、配置文件信息1.打开编辑文件2.输入以下内容4、拷贝mysql驱动5、更新guava包和hadoop一致6、mysql授权7、初始化8、hive启动模式9、Hadoop的core-site.xml配置二、Hive1、Hive的文件结构2、MySQL上Hive的元数据3、hadoop文件授…
阅读更多...
Doris的3种数据模型详解和数据仓库每一层的模型选用
Apache Doris是一个用于离线数据仓库开发的分布式SQL查询和分析引擎。在使用Doris进行离线数据仓库开发时,可以采用三种不同的数据模型:Duplicate模型、Aggregate模型和Unique模型。每种模型都有其适用的场景和特点,同时也对于不同层次的数据仓库有着不同的使用建议。 Dupl…
阅读更多...
離線數倉:用戶拉鏈錶推導過程
1.維度表 維度表有兩類: 1.全量快照表 离线数仓的计算周期通常为每天一次,可以每天保存一份全量的维度数据 优点是:简单有效,开发和维护成本都比较低,方便理解和使用 缺点是:浪费存储空间,尤其是…
阅读更多...
尚硅谷大数据项目《在线教育之离线数仓》笔记003
视频地址:尚硅谷大数据项目《在线教育之离线数仓》_哔哩哔哩_bilibili 目录 第8章 数仓开发之DIM层 P039 P040 P041 P042 P043 P044 P045 P046 P047 P048 第8章 数仓开发之DIM层 P039 第8章 数仓开发之DIM层 DIM层设计要点: (1&a…
阅读更多...