你回来了?
我们一直在隔壁!

python爬取网站热榜并发布到wordpress


# -*- coding:utf-8 -*-
import requests
from bs4 import BeautifulSoup
import re
import json
from wordpress_xmlrpc import Client, WordPressPost
from wordpress_xmlrpc.methods.posts import NewPost

# 这里是爬取网站的url
url = 'http://www.xxx.com/'

# 这里是wordpress的url
wp_url = 'http://www.xxx.com/xmlrpc.php'

# 这里是wordpress的用户名
wp_username = 'xxx'

# 这里是wordpress的密码
wp_password = 'xxx'

# 这里是要发布的文章的标题
wp_title = 'xxx网站热榜'

# 这里是要发布的文章的分类
wp_category = '最新'

# 这里是要发布的文章的标签
wp_tags = ['热榜', '最新']

# 这里是要发布的文章的内容
wp_content = ''

# 这里是爬取网站的数据
response = requests.get(url)
soup = BeautifulSoup(response.text, 'lxml')
hot_list = soup.find_all('div', class_='hot-list')
for hot in hot_list:
    title = hot.find('h3').text
    wp_content += '<h3>' + title + '</h3>'
    items = hot.find_all('li')
    for item in items:
        wp_content += '<p>' + item.text + '</p>'

# 这里是发布文章到wordpress
wp = Client(wp_url, wp_username, wp_password)
post = WordPressPost()
post.title = wp_title
post.terms_names = {
    'category': [wp_category],
    'post_tag': wp_tags
}
post.content = wp_content
post.post_status = 'publish'
wp.call(NewPost(post))
赞(0)
版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
文章名称:《python爬取网站热榜并发布到wordpress》
文章链接:https://www.gebizhan.com/1716.html
本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。

隔壁评论 抢沙发

快来看啊,隔壁站!

我们就是隔壁站的老王

隔壁邮箱隔壁TG

登录

找回密码

注册