Linux OOM机制

发表于 2022-04-03 | 分类于 Linux

记录一次程序总是异常中止的解决过程

问题描述：

开发的爬虫脚本在服务器上99%的时间都可以正常运行，但是偶尔会自动中止，进程消失。频率不固定，有的时候一天一次，有的时候一周一次，甚至很久不报错。后来解决该问题后，发现其实就是因为触发了某些条件才会出现异常，所以并不是有规律可言的。

解决过程

前面的这些解决过程不是很重要，实际是Linux系统的OOM机制导致程序被杀，不过遇到问题一般很难一开始就精准的定位到问题，都是一步步的推测问题产生的原因，然后不断地排除，直至问题的解决。所以前面这些步骤仅是在问题解决时的一些尝试性思路。

阅读全文 »

反爬（八）

发表于 2022-03-12 | 分类于爬虫

反爬八

网站介绍

本次破解目标网站，该网站是一个搜索式的网站，支持模糊搜索，我们输入“公司”进行搜索，发现有滑动验证码。

分析其网络请求，我们可以看到这样几个关键请求：

获取验证码的请求：https://neris.csrc.gov.cn/shixinchaxun/sxcx/captcha/get（实际为一个POST请求）

post参数

1
2
3

captchaType: "blockPuzzle"
clientUid: "slider-d063f7fa-f53c-4868-8fed-12d68cfe932b"
ts: 1647072841626

请求返回json数据，内容如下

阅读全文 »

Python sm4加解密

发表于 2022-01-27 | 分类于 python编程

安装模块gmssl，pip install gmssl

阅读全文 »

CRNN项目实践

发表于 2022-01-09 | 分类于深度学习

`CRNN`项目实战

之前写过一篇文章利用CRNN进行文字识别，当时重点讲的CRNN网络结构和CNN部分的代码实现，因为缺少文字数据集没有进行真正的训练，这次正好有一批不定长的字符验证码，正好CRNN主要就是用于端到端地对不定长的文本序列进行识别，当然是字符和文字都是可以用的，所以这里进行了一次实战。

主要是参考github项目：https://github.com/meijieru/crnn.pytorch

关于`lmdb`

lmdb安装

首先关于lmdb这个数据库，python有两个包，一个是lmdb，另一个是python-lmdb。

使用pycharm的包安装功能可以看到关于lmdb的描述

Universal Python binding for the LMDB 'Lightning' Database Version 1.3.0

关于python-lmdb的描述

simple lmdb bindings written using ctypes Version 1.0.0

所以理论上我们安装前者肯定是可以用的，但是经过亲身实践，

在pip环境中使用pip install lmdb确实可以正常使用；

但是在conda环境中，使用conda install lmdb安装完成之后却无法导入包。

所以又使用：conda install python-lmdb安装，安装完之后却可以使用，非常奇怪。

后发现原因大概率是版本问题，使用pip可以安装lmdb=1.3.0的最新版本，而conda只能安装lmdb=0.9.x的版本，所以目前在conda中只能使用python-lmdb暂替使用。

制作适用`CRNN`的`lmdb`数据集

github项目中关于如何训练自己的数据集写的不是很清楚，如果我们直接运行train.py会遇到各种问题，首先第一个问题就是数据集的问题，lmdbDataset中的初始化

阅读全文 »

Linux shell命令

发表于 2021-12-28 | 分类于 Linux

Linux shell命令

vim程序编译器

vi分为3种模式，分别是一般命令模式，编辑模式与命令行模式。

一般命令模式：以vi/vim打开一个文件就直接进入一般命令模式，在该模式下可以进行光标移动、复制、粘贴、删除操作。
编辑模式：在一般命令模式下，输入【i、o、a、r】(大写也可)，进入编辑模式。按【ESC】键回到一般命令模式。
命令行模式：在一般命令模式下，输入【: / ?】中的任何一个，进入到命令行模式，光标会移动到最下面一行，可以进行读取、保存、批量替换字符、退出vi、显示行号等操作。

编辑模式与命令行模式之间不可互相切换。