rclone简介

发表于 2021-05-04 分类于 CS ，中间件，对象存储
本文字数： 5.5k 阅读时长 ≈ 5 分钟

rclone

Rclone是一款的命令行工具，支持在不同对象存储、网盘间同步、上传、下载数据。

支持的主流对象存储：

Google Drive
Amazon S3
Openstack Swift / Rackspace cloud files / Memset Memstore
Dropbox
Google Cloud Storage
Amazon Drive
Microsoft One Drive
Hubic
Backblaze B2
Yandex Disk
The local filesystem

安装

阅读全文 »

python deque双向队列

发表于 2019-07-04 分类于 CS ， programing ， lan ， python ， cpython源码， collections ， deque
本文字数： 1.3k 阅读时长 ≈ 1 分钟

Python标准库中包含了四种队列，分别是queue.Queue、asyncio.Queue、multiprocessing.Queue、collections.deque。
可见deque是标准库collections中的

Deque队列是由栈或者queue队列生成的（发音是 “deck”，”double-ended queue”的简称）。
Deque 支持线程安全，内存高效添加(append)和弹出(pop)，从两端都可以，两个方向的大概开销都是 O(1) 复杂度。

虽然 list 对象也支持类似操作，不过这里优化了定长操作和 pop(0) 和 insert(0, v) 的开销。
它们引起 O(n) 内存移动的操作，改变底层数据表达的大小和位置。

如果 maxlen 没有指定或者是 None ，deques 可以增长到任意长度。
否则，deque就限定到指定最大长度。一旦限定长度的deque满了，当新项加入时，同样数量的项就从另一端弹出。
限定长度deque提供类似Unix filter tail 的功能。它们同样可以用与追踪最近的交换和其他数据池活动。

deque还支持迭代，清洗，len(d), reversed(d), copy.copy(d), copy.deepcopy(d), 成员测试 in 操作符，
和下标引用 d[-1] 。索引存取在两端的复杂度是 O(1)，在中间的复杂度比 O(n) 略低。要快速存取，使用list来替代。

阅读全文 »

Python 整数对象

发表于 2019-07-03 分类于 CS ， programing ， lan ， python ， cpython源码， objects ， long
本文字数： 5.3k 阅读时长 ≈ 5 分钟

Python2 的整数对象有 PyIntObject 和 PyLongObject 这两种类型，Python3 只保留了 PyLongObject。
这里我们介绍一下python3的PyLongObject。

Python 3.7.3 (default, Mar 27 2019, 22:11:17

# 类型
>>> a = 45
>>> type(a)
<class 'int'>

# 小整数

PyLongObject

PyTypeObject PyLong_Type = {
    PyVarObject_HEAD_INIT(&PyType_Type, 0)
    "int",                                      /* tp_name , 在python2中是long */
    offsetof(PyLongObject, ob_digit),           /* tp_basicsize */
    sizeof(digit),                              /* tp_itemsize */
    long_dealloc,                               /* tp_dealloc */
    ...
    long_new,                                   /* tp_new */
    PyObject_Del,                               /* tp_free */
};

我们可以看到，PyLong_Type类型对象的tp_name就是int，也就是说，在Python内部，它就是int类型。

阅读全文 »

Python Dict对象源码

发表于 2019-03-03 分类于 CS ， programing ， lan ， python ， cpython源码， objects ， dict
本文字数： 18k 阅读时长 ≈ 17 分钟

Python 字典

Dictionary object implementation using a hash table ，通过描述可知，python 的字典就是实现了一个 hash 表。

Python 字典概述

在 python 的字典中，一个键值对的对应保存就是 PyDictEntry 类型来保存；

源文件：Include/dict-common.h

阅读全文 »

Python List 对象

发表于 2019-03-03 分类于 CS ， programing ， lan ， python ， cpython源码， objects ， list
本文字数： 1.3k 阅读时长 ≈ 1 分钟

List跟Java的ArrayList、STL中的vector相似。

在Python中的list可以存放任何类型的数据，查看PyListObject可以发现，list实际存放的是PyObject* 指针

PyListObject

list对象是一个变长对象，在运行时动态调整其所维护的内存和元素，并且支持插入删除等操作，list的定义如下:

// listobject.h

typedef struct {
    PyVarObject ob_base;   // 即 PyObject_VAR_HEAD
    PyObject **ob_item;    // 数组
    Py_ssize_t allocated;  // 可容纳元素的总数，0 <= ob_size <= allocated
} PyListObject;

阅读全文 »

非局部连接网络 Non-local Neural Network

发表于 2018-12-02 分类于机器学习， app ， vision ， self-attention-in-cv
本文字数： 977 阅读时长 ≈ 1 分钟

背景

dependencies between spatial or temporal local regions.

通常利用卷积(滤波器)等操作，可以实现局部依赖，但是如何获取图像/视频中的长距离依赖？self-attention给我们提供了一个很好的思路，它能捕获任意距离的依赖。

空间Attention

dependencies between any spatial pixels

阅读全文 »

BERT用于语言模型的方案

发表于 2018-12-01 分类于机器学习， app ， nlp ， lm_and_pretrain ， model ， nnlm ， tansformers
本文字数： 4.6k 阅读时长 ≈ 4 分钟

背景

BERT取得了较大成功，但是原始的模型并不能直接用于对句子打分 #35，也就是常规的语言模型任务。
如何利用bert的预训练模型对句子打分？

序列掩码的方式应该比较合理。

并非autoregressive结构，速度较快

方案

阅读全文 »

BERT

发表于 2018-11-25 分类于机器学习， app ， nlp ， lm_and_pretrain ， model ， nnlm ， tansformers
本文字数： 1.9k 阅读时长 ≈ 2 分钟

简介

本文介绍了一种新的语言表征模型 BERT——来自 Transformer 的双向编码器表征。与最近的语言表征模型不同，BERT 旨在基于所有层的左、右语境来预训练深度双向表征。BERT 是首个在大批句子层面和 token 层面任务中取得当前最优性能的基于微调的表征模型，其性能超越许多使用任务特定架构的系统，刷新了 11 项 NLP 任务的当前最优性能记录。

motivation

RNN 在计算时，有时间的依赖性，并行度受限；而 CNN 受制于有限的 receptive field，因此，信息传递太慢。QRNN 希望能综合RNN和CNN的优点，尽量避免各自的缺陷。

model

$$
\mathbf{Z} = \tanh(\mathbf{W} _ z * \mathbf{X})
$$

阅读全文 »

ESON

rclone简介

rclone

安装

python deque双向队列

Python 整数对象

PyLongObject

Python Dict对象源码

Python 字典

Python 字典概述

Python List 对象

PyListObject

非局部连接网络 Non-local Neural Network

背景

空间Attention

BERT用于语言模型的方案

背景

方案

BERT

简介

相关工作

无监督sequence learning

tensorflow高层API -- Estimator

背景

准RNN Quasi-recurrent Neural Networks

motivation

model