沉思语录

取次花丛懒回顾,半缘修道半缘君


  • 首页

  • 归档

  • 标签

  • 搜索

numpy

发表于 2017-09-24 |

使用ipython进行数据分析

ipython有shell的接口也有web的接口
官网:https://ipython.org/
ipython功能:https://www.zhihu.com/question/51467397

运行:jupyter notebook –ip=0.0.0.0 –allow-root

特殊用法

  • Tab键自动补全
  • 内省,变量后跟?,显示变量的信息

入门教程:

https://zhuanlan.zhihu.com/p/24988491
书籍:
https://detail.tmall.com/item.htm?_u=om6p4lp35f6&id=36838488413

  1. 生成随机数
    numpy各种生成随机数的函数:http://www.jianshu.com/p/214798dd8f93
    numpy.random.seed
    https://www.reddit.com/r/learnpython/comments/3nidns/how_to_use_numpyrandomseed/
    用法:numpy.random.seed(num1)
    生成随机数
    下一次再生成随机数的时候再调用一次numpy.random.seed(num1)
    依然生成同样的随机数
    如果numpy.random.seed(num2)
    再生成随机数就是不同的随机数
  1. Numpy.genfromtxt
    从文件读取数据
    http://www.jianshu.com/p/82110f1dbb94

  2. array.tolist
    作用:convert a NumPy array to a Python List
    https://docs.scipy.org/doc/numpy/reference/generated/numpy.ndarray.tolist.html
    b = a.tolist()
    重新创建
    a = np.array(b)

  3. 广播法则
    处理不同维度的矩阵之间的运算
    https://ptorch.com/news/38.html

  4. 从文件读取数据
    np.genfromtxt(filename)
    http://www.jianshu.com/p/82110f1dbb94

docker

发表于 2017-09-21 |

基本概念

  • docker daemon
  • image
  • container
  • network
  • label:https://docs.docker.com/engine/userguide/labels-custom-metadata/
  • storage driver:http://dockone.io/article/1765
  • volumes

安装

centos上面用这个区安装
https://docs.docker.com/install/linux/docker-ce/centos/

像Suse这样的OS找不到镜像的话,可以直接下载二进制包去安装
https://docs.docker.com/install/linux/docker-ce/binaries/
参考docker-ce 里面的Binaries下面的方法
安装之后,follow这个链接的最下面去创建systemd的配置项
https://docs.docker.com/config/daemon/systemd/#httphttps-proxy

常用命令

  • docker ps: 查看正在运行的container
  • 通过dockerfile去定义image: https://docs.docker.com/get-started/part2/#apppy
  • dockerbuild 利用dockerfile去生成image docker build -t friendlyhello . (friendlyhello 镜像名)
    important: 在dockerfile里面用pip去安装包的时候也需要配置代理
  • docker images 查看有没有生成镜像
  • docker run -p 4000:80 friendlyhello (-p 4000:80 把container的80端口映射到 主机的4000端口)
    docker run -d -p 4000:80 friendlyhello(-d 参数表示运行在后台,in detached mode)
  • attach a container
    docker attach container_name
    这样就会进入contaienr内部
    要deattach这个container,Ctrl+P+Q
  • docker container ls(只显示activate的container)
    查看所有的container: docker container ls -a
    查看到container id
  • 停止正在运行的container
    docker stop container_id
    在容器内部直接exit
  • 删除container
    docker rm container_id
  • 删除image
    docker image rm image_id(必须要保证这个image没有container在使用)
  • copy文件
    docker copy * #copy文件

常用的一系列用法

下载好image以后
docker run -tid imagename
docker container ls
docker attach container-id #进入容器
host上docker cp等进行修改
docker commit container-id new-name #保存成新的镜像

Error messgae:

commit的时候看到error message
Error response from daemon: Error processing tar file(exit status 1): unexpected EOF
看dockerd的日志,是zip文件不能保存

docker save -o update1.tar update //镜像的导出
docker load < update1.tar //镜像的导入

删除文件,减小镜像大小

在container中删除文件之后,再commit发现镜像大小不变
是因为docker commit会保留原来的layer的信息

用export
docker export container_id > name_tag.tar
再次导入
docker import name_tag.tar name:tag

无法使用numa的问题

  1. docker run -itd –privileged image
    –privileged可以给container权限
    推荐用这个方法

  2. 方法二
    docker run -itd –cap-add=SYS_NICE image
    当方法1的performance掉了的话,用这个方法试试看

代理设置

为docker-run设置代理
https://docs.docker.com/config/daemon/systemd/#httphttps-proxy

为docker容器本身设置代理
和普通OS一样直接设置代理,试过可以工作
export http_proxy=http://***
export https_proxy=https://***

在启动container的时候可以添加参数
https://docs.docker.com/network/proxy/

http://www.vadmin-land.com/2018/09/using-docker-behind-a-proxy/

设置docker的工作目录

1
vi /etc/docker/daemon.json

And add the following to tell docker to put all its files in this folder, e.g:

1
2
3
4
{
"graph":"/workspace"
}
systemctl restart docker 之后

docker的工作目录就到了/workspace的目录下面

镜像目录

/workspace/docker_data/images

container目录

/workspace/docker_data/containers/

数据存储

/workspace/docker_data/volumes

  • 管理命令
    docker volume ls

docker volume rm volume_name

  • 指定volume的挂载位置
    指定挂在位置
    docker run -itd -v /data/:/data1 centos bash // -v 用来指定挂载目录,
    -v的格式为:

上传镜像

docker login
位image添加标签 docker tag image username/repository:tag
docker tag test1 lesliefang/get-started:v.0

docker image ls
会看到这个lesliefang/get-started:v.0 image

上传
docker push username/repository:tag
登录docker hub 可以看到相关的信息

阅读全文 »

深度学习知识点

发表于 2017-09-13 |
  • 玻尔兹曼机

  • 过拟合:偏差很小,但方差很大(所以欠拟合叫做高偏差,过拟合叫做高方差)
    训练数据太少,模型参数太多
    解决方法:1. 剔除不必要的模型参数 2. 使用正则化(regularizaion),保留模型参数,但是减小模型参数的数量级(对某些参数,在loss函数中添加惩罚项)

  • L2正则项
    解决过拟合的问题
    https://www.zhihu.com/question/20924039

  • 交叉验证
    https://baike.baidu.com/item/%E4%BA%A4%E5%8F%89%E9%AA%8C%E8%AF%81
    将数据集分成多个多个小的数据集,先用小数据集1训练,用小数据集2验证(评估正则化函数),直到最后一个小的数据集被用于验证

  • 极大似然估计
    http://www.jianshu.com/p/f1d3906e4a3e

  • 激活函数
    在神经网络中引入非线性的成分
    sigmod:0,1之间
    tanh:-1,1之间
    softmax: 多分类,一般用在输出层的激活

  • epoch、 iteration和batchsize
    http://blog.csdn.net/sinat_30071459/article/details/50721565

  • 交叉熵
    https://zhuanlan.zhihu.com/p/27223959
    在机器学习中,可以用交叉熵来定义loss function

  • BP神经网络
    反向传播计算——BackPropagation
    单个参数:http://www.cnblogs.com/charlotte77/p/5629865.html
    矩阵计算:http://www.jeyzhang.com/cnn-learning-notes-2.html

  • 卷积神经网络CNN
    局部连接,参数共享,卷积,池化等概念
    介绍:http://www.jeyzhang.com/cnn-learning-notes-1.html
    模型训练:http://www.jeyzhang.com/cnn-learning-notes-2.html

  • 局部对比归一化
    Local contrast normalization
    http://blog.csdn.net/zouxy09/article/details/10007237

  • batch normalization
    http://blog.csdn.net/hjimce/article/details/50866313
    http://minibatch.net/2017/06/11/%E7%BB%8F%E5%85%B8%E8%AE%BA%E6%96%87-Batch-Normalization/
    https://zhuanlan.zhihu.com/p/26682707
    反向计算梯度:http://mlnote.com/2016/12/20/Neural-Network-Batch-Normalization-and-Caffe-Code/

Good:https://kratzert.github.io/2016/02/12/understanding-the-gradient-flow-through-the-batch-normalization-layer.html

  • 白化
    http://blog.csdn.net/hjimce/article/details/50864602
    http://blog.csdn.net/whiteinblue/article/details/36171233
1…192021…28
Leslie

Leslie

记录心情与能力的成长

82 日志
15 标签
© 2021 Leslie
由 Hexo 强力驱动
主题 - NexT.Pisces
本站访客数 本站总访问量