导图社区 bi面试宝典
BI面试不用怕,看看这篇bi面试宝典,让你轻松拿下面试相关问题~内容包括项目、架构、数据库、kettle、linux等等,祝你成功~
社区模板帮助中心,点此进入>>
电商部人员工作结构
电费水费思维导图
D服务费结算
博弈的理解与运用
第三章 外国行政组织理论
培训计划思维导图
车队管理
《我不是药神》电影影评导图
管培生课程作业
行政人事工作分析
bi面试
项目
项目结果、做了什么、用了什么技术、几个人、怎么分工、遇到的问题+怎么解决
项目中写的最复杂的sql实现了什么功能
做了哪些清洗
错误的数据:比如字符串数据后面有回车空格、日期格式不正确、日期越界 重复的数据 简单的数据标准化,好比表和字段命名 默认值填充,好比性别为空的都补0 清洗规则十分明确,好比说说字段拆解 
清洗实例
https://blog.csdn.net/fengyuruhui123/article/details/53414612?utm_medium=distribute.pc_relevant.none-task-blog-2~default~baidujs_baidulandingword~default-1-53414612-blog-111328728.pc_relevant_3mothn_strategy_and_data_recovery&spm=1001.2101.3001.4242.2&utm_relevant_index=4
主要业务
银行
https://blog.csdn.net/acumen_leo/category_8963248.html
电商
怎么验证抽的数据是正确的
都用到哪些工具
调度工具
项目的维度
指标
口径的逻辑跟计算,是你跟业务去确认
数据量大小
数据库开发、etl开发比例
项目流程
什么是事实表以及维度表?工作中用到的事实表跟维度表有哪些?举例
主题域如何分
主题域就是把那些关联紧密但不同的数据主题,交汇融合到一个更大的主题域当中
系统
业务:商品、交易、物流

部门:生产、供应链、研发、销售
功能
主题
 https://juejin.cn/post/6982944202829070344
https://juejin.cn/post/6982944202829070344
架构
说说你对数仓的理解
最近的数仓架构,每一层干啥的,为什么要分层:更清晰管理数据库中的表
工作中你接触数据仓库那一块
你们用的雪花模型还是星型模型?
对三范式的理解
DW如何设计
数据中台和数据仓库、数据平台区别
https://cloud.tencent.com/developer/article/1472561
数据库
delete和truncate区别
自定义函数
字符串:
时间
聚合
开窗函数:有哪些,主要用来做什么
数据库之间同步:dblink
去重
查询去重
删除重复
count(*)和count(字段)
函数有哪些?什么情况下用到分析函数?分析函数和聚合函数的区别?
增量同步
缓慢变化
拉链表的定义
临时表
正则有用过吗
有用过游标么?
存储过程参数有哪些类型
异常处理有哪些
13.如何设置并行
8、对索引的理解,索引的执行机制,索引的优缺点,主键和唯一索引的区别?
存储过程
1.你们的存储过程都实现些什么功能?
存储过程的格式
存储过程和自定义函数区别
谈谈你对存储过程的优化
行转列 列转行
union union all 区别
kettle
抽数工具,跨库和同库抽数用什么实现
你们怎么抽数 有什么规则
开发中遇到过什么问题,你是怎么解决的
kettle部署:
具体修改哪些配置
KETTLE纯抽数的优化
用KETTLE抽数,1000万的数据要抽多久?
kettle版本
换成其他数据库需要修改哪些配置
对应shu'ju库的jar包
百分多少做kettle
kettle优点
linux
子主题
其他
如果一个系统有300多张报表,80多张关键的报表,其余还有控件之类的工具,要多长时间熟悉并且独立开发?
平时加班情况,对加班的看法
你的职业规划,期望薪资,到岗日期
你还有什么想问的
hadoop
基本构造、原理: