# -*- coding:utf-8 -*-
import requests
from bs4 import BeautifulSoup
import re
import json
from wordpress_xmlrpc import Client, WordPressPost
from wordpress_xmlrpc.methods.posts import NewPost
# 这里是爬取网站的url
url = 'http://www.xxx.com/'
# 这里是wordpress的url
wp_url = 'http://www.xxx.com/xmlrpc.php'
# 这里是wordpress的用户名
wp_username = 'xxx'
# 这里是wordpress的密码
wp_password = 'xxx'
# 这里是要发布的文章的标题
wp_title = 'xxx网站热榜'
# 这里是要发布的文章的分类
wp_category = '最新'
# 这里是要发布的文章的标签
wp_tags = ['热榜', '最新']
# 这里是要发布的文章的内容
wp_content = ''
# 这里是爬取网站的数据
response = requests.get(url)
soup = BeautifulSoup(response.text, 'lxml')
hot_list = soup.find_all('div', class_='hot-list')
for hot in hot_list:
title = hot.find('h3').text
wp_content += '<h3>' + title + '</h3>'
items = hot.find_all('li')
for item in items:
wp_content += '<p>' + item.text + '</p>'
# 这里是发布文章到wordpress
wp = Client(wp_url, wp_username, wp_password)
post = WordPressPost()
post.title = wp_title
post.terms_names = {
'category': [wp_category],
'post_tag': wp_tags
}
post.content = wp_content
post.post_status = 'publish'
wp.call(NewPost(post))
python爬取网站热榜并发布到wordpress
版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
文章名称:《python爬取网站热榜并发布到wordpress》
文章链接:https://www.gebizhan.com/1716.html
本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。
文章名称:《python爬取网站热榜并发布到wordpress》
文章链接:https://www.gebizhan.com/1716.html
本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。