python中生成字符串序列(python实现字符串加密 生成唯一固定长度字符串)
类别:脚本大全 浏览量:1884
时间:2021-11-05 14:48:08 python中生成字符串序列
python实现字符串加密 生成唯一固定长度字符串背景
有时候爬虫爬过的url需要进行指纹核对,比如Scrapy就是进行指纹核对,如果是指纹重复则不再爬取。当然在入库的时候我还是需要做一次核对,否则如果爬虫有漏掉,进入数据库就不合适了。
思路
根据Scrapy的指纹生成方式,这次的指纹生成方式也是用hash的MD5对目标URL进行加密,生成固定长度的字符串,然后在数据库里面将字段设置成unique,这样的话在保证url固定长度的情况下还能够保证入库后的唯一性,进最大努力避免出现重复的数据。
指纹生成代码
新建一个文件,然后在里面编写指纹生成的方法,在使用的时候from import进来,调用方法即可。代码为:
|
import hashlib def get_md5(url): """ 由于hash不处理unicode编码的字符串(python3默认字符串是unicode) 所以这里判断是否字符串,如果是则进行转码 初始化md5、将url进行加密、然后返回加密字串 """ if isinstance (url, str ): url = url.encode( "utf-8" ) md = hashlib.md5() md.update(url) return md.hexdigest() |
为了验证代码的可用性,再加上代码:
|
if __name__ = = "__main__" : urls = "http://www.baidus.com" print (get_md5(urls)) |
在本地运行无误,再把下面这串删除。等到调用的时候from import get_md5把文件和方法引入,就可以使用了
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持开心学习网。
原文链接:https://blog.csdn.net/QuinnSpider/article/details/82847152
您可能感兴趣
- python中怎样将字符串倒序(python字符串循环左移)
- python统一支付接口(Python实现的微信支付方式总结三种方式)
- python面向对象编写案例(Python面向对象程序设计示例小结)
- python完整异常机制(深入理解Python异常处理的哲学)
- python 模块详解(举例讲解Python常用模块)
- python自动计算机器人(python实现nao机器人手臂动作控制)
- python时间类的实现(Python日期时间Time模块实例详解)
- 聊天室python小程序(用Python写一个模拟qq聊天小程序的代码实例)
- python中的迭代器详解(Python通过for循环理解迭代器和生成器实例详解)
- python中怎么输入单引号(python三引号输出方法)
- python怎么安装queue(python队列Queue的详解)
- python3循环使用教程(Python3.5常见内置方法参数用法实例详解)
- python 基于内容的推荐系统(不到40行代码用Python实现一个简单的推荐系统)
- python基础知识重点(python语言元素知识点详解)
- opencv提取图像轮廓python代码(Python基于opencv调用摄像头获取个人图片的实现方法)
- python处理tcp包(Python3使用TCP编写一个简易的文件下载器功能)
- 超撩人治愈的绝美水彩,原来出自她之手 一笔一画令无数人沉醉(超撩人治愈的绝美水彩)
- 新手的勾线(新手的勾线)
- ()
- 书法欣赏 宋.志南诗《绝句》(宋.志南诗绝句)
- 每周一首古诗 《绝句》(每周一首古诗绝句)
- 蓝色代表什么(蓝色代表什么性格的人)
热门推荐
- 服务器怎么做到实时备份(香港云服务器数据备份周期多久最好?)
- 怎么查看自己搭建的ftp服务器(你懂怎么建立 FTP 服务器么?)
- iis7安全设置(IIS7 IIS8 http自动跳转到HTTPS80端口跳转443端口)
- System.Action委托
- sqlite删除数据(SQLite Delete详解及实例代码)
- mysql写入效率越来越差(MYSQL大量写入问题优化详解)
- Uncaught RangeError: Maximum call stack size exceeded的常见原因
- linux中基本操作系统有什么(Linux操作系统的概述与简介)
- mysql最佳配置(详解DBeaver连接MySQL8以上版本以及解决可能遇到的问题)
- tcp协议实现两个基本功能(TCP性能调优实现原理及过程解析)
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9