-
大小: 281KB文件类型: .zip金币: 1下载: 0 次发布日期: 2021-05-27
- 语言: Python
- 标签: elasticsearc mongodb python django
资源简介
利用mongodb、django、elasticsearch等搭建的小型搜索引擎。数据由scrapy框架爬取存入mongodb中,具体使用方法请移步我的github:https://github.com/Weifanwong/search_engine.git
代码片段和文件信息
from datetime import datetime
from elasticsearch_dsl import DocType Date Nested Booleananalyzer Completion Keyword Text Integer
from elasticsearch_dsl.connections import connections
from elasticsearch_dsl.analysis import CustomAnalyzer
connections.create_connection(hosts=[‘127.0.0.1‘])
class Analyzer(CustomAnalyzer):
def get_analysis_definition(self):
return {}
ik_analyzer = Analyzer(‘ik_max_word‘ filter=[‘lowercase‘])
class ShuimuType(DocType): #
title = Text(analyzer=“ik_max_word“)
content = Text(analyzer=“ik_max_word“)
article_id = Keyword()
origin_url = Keyword()
avatar = Keyword()
author = Keyword()
pub_time = Date()
read_count = Integer()
like_count = Integer()
word_count = Integer()
subjects = Text(analyzer=“ik_max_word“)
comment_count = Integer()
class Index:
name = ‘my-index‘
# doc_type = ‘jianshu‘
# index = “scrapy“
if __name__ == “__main__“:
ShuimuType.init()
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2019-02-19 10:43 qsinghua\
文件 6148 2018-12-16 19:26 qsinghua\.DS_Store
目录 0 2019-02-20 15:20 qsinghua\.git\
文件 66 2018-12-20 10:59 qsinghua\.gitattributes
文件 17 2019-02-20 15:20 qsinghua\.git\COMMIT_EDITMSG
文件 305 2018-12-20 11:00 qsinghua\.git\config
文件 37 2018-12-20 10:59 qsinghua\.git\desc
文件 100 2019-02-20 15:10 qsinghua\.git\FETCH_HEAD
文件 23 2018-12-20 10:59 qsinghua\.git\HEAD
目录 0 2018-12-23 11:11 qsinghua\.git\hooks\
文件 478 2018-12-20 10:59 qsinghua\.git\hooks\applypatch-msg.sample
文件 896 2018-12-20 10:59 qsinghua\.git\hooks\commit-msg.sample
文件 3327 2018-12-20 10:59 qsinghua\.git\hooks\fsmonitor-watchman.sample
文件 189 2018-12-20 10:59 qsinghua\.git\hooks\post-update.sample
文件 424 2018-12-20 10:59 qsinghua\.git\hooks\pre-applypatch.sample
文件 1638 2018-12-20 10:59 qsinghua\.git\hooks\pre-commit.sample
文件 1348 2018-12-20 10:59 qsinghua\.git\hooks\pre-push.sample
文件 4898 2018-12-20 10:59 qsinghua\.git\hooks\pre-reba
文件 544 2018-12-20 10:59 qsinghua\.git\hooks\pre-receive.sample
文件 1492 2018-12-20 10:59 qsinghua\.git\hooks\prepare-commit-msg.sample
文件 3610 2018-12-20 10:59 qsinghua\.git\hooks\update.sample
文件 6108 2019-02-20 15:20 qsinghua\.git\index
目录 0 2018-12-23 11:11 qsinghua\.git\info\
文件 240 2018-12-20 10:59 qsinghua\.git\info\exclude
目录 0 2018-12-23 11:11 qsinghua\.git\logs\
文件 1093 2019-02-20 15:20 qsinghua\.git\logs\HEAD
目录 0 2018-12-23 11:11 qsinghua\.git\logs\refs\
目录 0 2018-12-23 11:11 qsinghua\.git\logs\refs\heads\
文件 1093 2019-02-20 15:20 qsinghua\.git\logs\refs\heads\master
目录 0 2018-12-23 11:11 qsinghua\.git\logs\refs\remotes\
目录 0 2018-12-23 11:11 qsinghua\.git\logs\refs\remotes\origin\
............此处省略268个文件信息
- 上一篇:HOG_SVM的python实现
- 下一篇:Horland-运维监控系统
相关资源
- HOG_SVM的python实现
- python编写的类似QQ的聊天工具
- scrapy 封装的爬取社保信息
- 用Python实现语音的传输功能
- python实现谱聚类代码并进行可视化
- 解析pcap数据包
- Python实现香农码_费诺码_霍夫曼码
- python svm 源码
- 基于python的推荐系统库
- 本地两个文件夹同步,python语言,l
- 图像相似度计算python
- 交大python课大作业
- 基于selenium模拟天眼查登录并爬取企业
- python小游戏完美解决大作业.zip
- Python编程 第四版 真正的完整版
- python开发用到的工具书籍一套全
- Python包:baidumapAPI
- python实现图书借阅系统
- python爬虫样例
- 特征空间可视化.py
- 希尔密码.py Python 矩阵实现希尔密码
- python 获取文件夹下文件名称并写入到
- python面向对象课件
- Python快速编程入门的课后习题答案(
- Python爬虫代码
- 搜集和整理的100道Python考试题.docx
- 手写体数字识别原始数据和贝叶斯代
- Python环境下利用matplotlib绘制发动机万
- 基于Python+Theano实现的Lenet5源代码(附
- Python 中文手册.chm
评论
共有 条评论