志炜 叶 志炜 叶

常见因果推断方法梳理

本文尝试去梳理了因果推断的类型,并且列举了不同类型推断下的常用方法,希望能帮助大家了解因果推断怎么运用于不同的情景。

本文的框架如下:

1.因果推断到底在做什么?

2.因果推断的分类和常见的因果推断方法:统计实验(Statistical Experiment)、准实验(Quasi-experiment)、反事实(Counterfactuals)

Read More
志炜 叶 志炜 叶

数据和统计学常识

本文用于记录关于数据和统计学的零碎知识,以及自己关于数据的杂思。

目前已经尝试回答的问题如下:

1.数据的几种本质用途

2.伯克松悖论selection bias和辛普森悖论confounding bias

3.完全随机试验CRD(Completely Randomized Design)和随机区组实验RCB(RCB Randomized Complete Blocking)

4.常用的三大检验:t/z检验,F检验,卡方检验

5.常见的分布汇总

6.协方差与相关系数的关系

Read More
志炜 叶 志炜 叶

怎么设计月报指标体系 - 月报、周报、日报到底在解决什么问题?

因为在滴滴的时候参与过月报的设计,同时也要做日报,因此自己对日报、月报、周报的作用进行了一些思考,本文尝试回答我们怎么去设计月报,并且尝试讲明白三个报表的作用和关系。

本文的框架如下:

1.怎么设计一个完善的月报指标体系 ?

2.怎月报、周报、日报到底通过数据在解决什么问题?

Read More
志炜 叶 志炜 叶

算法/建模业务实操逻辑pipeline

上了NUS MSBA的课之后发现,很多新入门数据建模的人其实对于算法、模型之类的信息很好获取,但是大部分人却很难知道整个建模的过程到底是怎样,因此在采访了一位做算法的朋友后,整理一个算法/建模pipeline的采访纪要,供大家参考。

*不适合大数据架构的建模

Read More
志炜 叶 志炜 叶

成都咖啡厅地图爬虫项目

本文是一个爬虫项目展示,起因是因为要去成都旅游,同时自己是咖啡爱好者,所以通过“爬虫+百度地图API+Tableau”制作了一张成都咖啡厅地图,以此来让自己可以住在更好/更多的咖啡厅附近。

Read More
志炜 叶 志炜 叶

联邦学习简述

一次和做联邦学习的博士朋友吃饭,刚好聊到联邦学习,因此尝试梳理了一下联邦学习的框架,希望能帮助大家对联邦学习有一个比较完整的概念理解。(本文为访谈纪要的形式)

本文的框架如下:

1.联邦学习是什么

2.联邦学习运作逻辑

3.联邦学习重要组成部分

4.联邦学习常见运用场景

Read More
志炜 叶 志炜 叶

数据是什么?数据驱动在讲什么?

做了一些数据分析的实习之后,自己对数据分析会有一些思考,因此本文尝试去回答以下两个问题,来帮助大家更好的认识“数据”和“数据驱动”

1.数据是什么

2.为什么数据驱动突然火了起来

Read More