第十周实训-部分代码

博主： dayi
发布时间：2024 年 04 月 30 日
645 次浏览
暂无评论
18203字数
分类：默认分类

第十周实训

部分内容

:::success
Yes :tada:
:::

第一个代码

# 单行注释
'''
# 单行注释
'''
str="我是一只来自北方的狼"
bnum=True
#复赋
com=2+1j
print(type(com))

if type(com)==complex:
    print("我是复数来着")

#列表    
list1 = [1,3,4,True,com,str]
for item in list1:
    print(item,"***********************\n")
    
list1.append("哈哈哈 我是卖报的小行家")
#删除第一项
del list1[0]
print(list1)
#自增运算法，数据不能跨越类型，可以进行拼接
tub1 = (1,2,3,4,5,6,7)
tub2 = ("a","b","c","d","e","f","g")
#tub = tub1+tub2
#tub1[0]=888
#print(tub)
[(1,"a"), (2,"b"), (3,"c")]

list1 = [ item  for item in zip(tub1,tub2)]  
print(list1)

# 单行注释
'''
# 单行注释
'''
str = "我是一只来自北方的狼"
bnum = True
# 复赋
com = 2 + 1j
print(type(com))

if type(com) == complex:
    print("我是复数来着")

# 列表
list1 = [1, 3, 4, True, com, str]
for item in list1:
    print(item, "***********************\n")

list1.append("哈哈哈 我是卖报的小行家")
# 删除第一项
del list1[0]
print(list1)
# 自增运算法，数据不能跨越类型，可以进行拼接
tub1 = (1, 2, 3, 4, 5, 6, 7)
tub2 = ("a", "b", "c", "d", "e", "f", "g")
# tub = tub1+tub2
# tub1[0]=888
# print(tub)
[(1, "a"), (2, "b"), (3, "c")]

list1 = [item for item in zip(tub1, tub2)]
print(list1)

list1 = [ item for item in zip(tub1,tub2)]

# 序列 作业
list2 = sorted(list1,key=lambda x:x[0],reverse=False)
print(list2)
#字典 使用对应Java Map类似  属性:属性值
dict1={
    "name":"古他那黑暗之神赵四",
    "age":20,
    "hobby":"亚洲舞王之炸雷"
}

print(list(dict1.keys()))
print(list(dict1.values()))
#集合
lis3  =[{
    'name':'尼古拉嘶赵四',
    'age':60,
    "hobby":"亚洲舞王之炸雷"

},{
    "name":"最强最强妖王谢广坤",
    "age":62,
    "hobby":"作妖",
},{
    "name":"迈克尔刘能",
    "age":60,
    "hobby":"烫头"}
]

import csv
#将数据库写入到表格
#写入字符串 模式 wb写入字节码 ，会覆盖原来的数据
#a 追加模式,念在末尾添加的数据,不会覆盖
#r读入模式 rb读入学节码
with open("infor.csv","w",newline="",encoding="utf-8") as f:
  #获取写入器
  write = csv.DictWriter(f,fieldnames=["name","age","hobby"])
  write.writerows(lis3)

with open("infor.csv","r",encoding="utf-8") as f:
  fread = csv.DictReader(f,fieldnames=["name","age","hobby"])
  print("*****************************************")
  for item in fread:
    print(item)

第二个代码

def difNum(list1):
    for item1 in list1:
        for item2 in list1:
            if item1 != item2:
                list2.append("%d%d" % (item1, item2))

    for item3 in list2:
        if item3 not in list3:
            list3.append(item3)

    print(list3)


# 构建一组数，一个数的两位不重复，数之间也不重复
list1 = [1, 2, 3, 4, 6, 7, 8, 8, 9, 9, 5, 3]
list2 = []  # 用来装载中间变量的列表
list3 = []  # 最终去除重复的列表
difNum(sorted(list1))

code3 类继承

class Person:
    name="人类"
    age=20

    # 初始化函数
    # 父类独有的属性子类不能继承
    __priMoney=5000
    def __init__(self):
        self.name = "小明"
        self.age = 40

    #动态函数
    def MyPrint(self):
        print(self.name,f"{self.age}了，大龄剩男",)
        return "搞钱吧，别想别的，你已经不是充钱的少年了"

    #构析函数
    def __del__(self):
        print("end_Person_class")

class Mother:
    def fly(self):
        print("会飞翔")

class Child(Person,Mother):
    name = "小强"
    age = 18
    # def __init__(self):
    #    self.name = "小量"
    #    self.age = 17
    __priMoney = 1000
    # 定义类的函数
    def SayHello(self):
        print("你好,我是{0},我今年{1}岁了".format(self.name, self.age))
    def MyPrint(self):
        print("我是子类的输出函数")
        print(self.name, "{}了,人够男的".format(self.age))
        return "愉快吧,别想别的,你已经不是充钱的少年了"

    def priv_money(self):
        print("私房钱剩余",self.__priMoney)

pass

if __name__=="__main__":
    cc = Child()
    cc.SayHello()
    cc.MyPrint()
    cc.fly()
    cc.priv_money()

code4 豆瓣爬虫

镜像源

快下但是好像pycharm不是很喜欢。卡卡的

北外(ustc跳转)镜像源:https://mirrors.ustc.edu.cn/pypi/web/simple

或者直接通过pip install requests beautifulsoup4 bs4 -i https://mirrors.ustc.edu.cn/pypi/web/simple安装

代码

# 获取请求,给远程服务器发送信息 获取数据
import requests
# 网页都是标签组成的,标签之间有嵌套,BeautifulSoup把标签层级化,可以通过内部方法,找到标签属性,和文字
from bs4 import BeautifulSoup
import lxml
import time

url = 'https://movie.douban.com/subject/36208094/comments?status=P'

# 浏览器头部伪装
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36",
    "Host": "movie.douban.com",
    "Cookie": "ll='108302'; bid=UNCukvvPqR8; __pk_id.100001.4cf6=ba0528c5b4d17da0.1704161561.; __yadk_uid=NAiBkhl9crL0ghh6yzHiXUPk"
}

# 获取豆瓣浏览器的响应信息
resp = requests.get(url=url, headers=headers)
print(resp.status_code)
# print(resp.text)

# 解析网页源码
bs = BeautifulSoup(resp.content, "lxml")

# 先找到所有的div class='comment-item'
divs = bs.find_all("div", attrs={"class": "comment-item"})
# print(divs)

for item in divs:
    # 当前的item是每个昵称下的评论块
    review = item.find("span", attrs={"class": "short"}).text
    print("*********************************")
    print(review)

    nickname = item.find("span", attrs={"class": "comment-info"}).find("a").text
    # 输出昵称
    print(nickname)

    score_tag = item.find("span", attrs={"class": "rating"})
    if score_tag:
        score = score_tag['title']
        print(score)
    else:
        print("No rating found")

code5 爬虫爬多页


# 获取请求,给远程服务器发送信息 获取数据
import requests
# 网页都是标签组成的,标签之间有嵌套,BeautifulSoup把标签层级化,可以通过内部方法,找到标签属性,和文字
from bs4 import BeautifulSoup
import lxml
import time

# 浏览器头部伪装
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36",
    "Host": "movie.douban.com",
    "Cookie": "ll='108302'; bid=UNCukvvPqR8; __pk_id.100001.4cf6=ba0528c5b4d17da0.1704161561.; __yadk_uid=NAiBkhl9crL0ghh6yzHiXUPk"
}

# 装载所有数据的列表
list = []

for i in range(10):
    try:
        time.sleep(1)
        url = f"https://movie.douban.com/subject/36208094/comments?start={i * 20}&limit=20&status=P&sort=new_score"
        # 获取豆瓣浏览器的响应信息
        resp = requests.get(url=url, headers=headers)
        print(resp.status_code)
        # print(resp.text)

        # 解析网页源码
        bs = BeautifulSoup(resp.content, "lxml")
        # 先找到所有的div class='comment-item'
        divs = bs.find_all("div", attrs={"class": "comment-item"})
        # print(divs)

        for item in divs:
            dict1 = {}
            # 当前的item是每个昵称下的评论块
            review = item.find("span", attrs={"class": "short"}).text
            print("*********************************")
            print(review)

            nickname = item.find("span", attrs={"class": "comment-info"}).find("a").text
            # 输出昵称
            print(nickname)

            score_tag = item.find("span", attrs={"class": "rating"})
            if score_tag:
                score = score_tag['title']
                print(score)
            else:
                score = "No rating found"

            dict1['nickname'] = nickname
            dict1['review'] = review
            dict1['score'] = score
            list.append(dict1)

    except Exception as e:
        print("出现了异常了", e)
        # 这条忽略去下一条
        continue

import csv

print("总数据是", list)

# 爬取数据,并且将数据写入到第二十条.csv
with open("第二十条.csv", "w", newline="", encoding="utf-8") as f:
    # 获取写入器
    fwrite = csv.DictWriter(f, fieldnames=["nickname", "review", "score"])
    fwrite.writerows(list)

code6 词云1

#pandas做逻辑清洗
import pandas as pd
from wordcloud import WordCloud
#将彩色图片转化为数字,numpy进行矩阵运算
import numpy as np
#Image.open可以将图片导入到内存当中
from PIL import Image

#测试图片导入python内存中
image = np.array(Image.open("image/111.jpg"))
#print(image)

#通过pandas直接读取csv文件
data = pd.read_csv('第二十条.csv', names=['nickname','review','score'])
#将所有的评论放到一个列表
listCom1 = data['review'].tolist()

#可以将词语中的主谓宾提炼出来
import jieba
#切分词云,join(listCom1)将列表转化为字符串
listCom2 = jieba.lcut(",".join(listCom1))
#strWord = "".join(listCom2)
list2 = []
for item in listCom2:
    #print(item)
    if len(item) > 1:  # 只保留长度大于1的词
        list2.append(item)

#统计哪些词语出现的频率比较高
import collections
#统计各个词语频率
word_fre = collections.Counter(list2)
print(word_fre)

# 生成词云
wc = WordCloud(
    background_color='white',
    mask=image,
    font_path='font/SourceHanSansHWSC-Bold.otf',  # 设置中文字体
    max_words=1000,  # 最多显示词数
    max_font_size=300  # 最大字号
)
wc.generate_from_frequencies(word_fre)
wc.to_file('词云.jpg')  # 保存词云图片

code7 词云2

去掉语气词

#pandas做逻辑清洗
import pandas as pd
from wordcloud import WordCloud
#将彩色图片转化为数字,numpy进行矩阵运算
import numpy as np
#Image.open可以将图片导入到内存当中
from PIL import Image

#测试图片导入python内存中
image = np.array(Image.open("image/111.jpg"))
#print(image)

#通过pandas直接读取csv文件
data = pd.read_csv('第二十条.csv', names=['nickname','review','score'])
#将所有的评论放到一个列表
listCom1 = data['review'].tolist()

#可以将词语中的主谓宾提炼出来
import jieba
#切分词云,join(listCom1)将列表转化为字符串
listCom2 = jieba.lcut(",".join(listCom1))
#strWord = "".join(listCom2)
list2 = []
for item in listCom2:
    #print(item)
    if len(item) > 1:  # 只保留长度大于1的词
        list2.append(item)

#统计哪些词语出现的频率比较高
import collections
#统计各个词语频率

list3= [ ]


filter_word = [',', '的', '。', '了', '是', '我', '很', '在', '', '电影']

for word in list2:
    if word in filter_word:
        continue
    if len(word) > 1:
        list3.append(word)
word_fre = collections.Counter(list3)
print(word_fre)

# 生成词云
# 生成词云
wc = WordCloud(
    background_color='white',
    mask=image,
    font_path='font/SourceHanSansHWSC-Bold.otf',  # 设置中文字体
    max_words=1000,  # 最多显示词数
    max_font_size=300  # 最大字号
)
wc.generate_from_frequencies(word_fre)
wc.to_file('第二十条词云.jpg')  # 保存词云图片

code 8 flask

from flask import Flask, render_template, request

app = Flask(__name__)

# 默认路径的处理函数(路由)
@app.route("/")
def home():
    return "<h1 style='color:red'>今天天气有点热，吃不进饭</h1>"

@app.route("/index")
def index():
    return render_template('index.html')

# 启动 Flask 服务器
if __name__ == "__main__":
    app.run(port=9999, debug=True)

code 9 index.html

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>Title</title>
    <style>
        img {
            width:600px;
            height:500px;
            position: absolute;
            top:0;
            right:0;
            bottom:0;
            left:0;
            margin: auto
        }
    </style>
</head>
<body>
   <img  src="../static/img/第二十条词云.jpg"/>
</body>
</html>

code 10 复制下文件

压缩包解压拖过去就可以

app.py

from flask import Flask, render_template, request

app = Flask(__name__)

# 默认路径的处理函数(路由)
@app.route("/")
def home():
    return render_template("index.html")

@app.route("/welcome")
def welcome():
    return render_template("welcome.html")

@app.route("/wordcloud")
def wordcloud():
    # Assuming wordcloud.html is a valid template
    return render_template("wordcloud.html")

# 启动 Flask 服务器
if __name__ == "__main__":
    app.run(port=9999, debug=True)

fix:

wordcloud_html：

<!DOCTYPE html>
<html lang="en">


<head>
    <meta charset="UTF-8">
    <title>Title</title>
    <style>
        img {
            width:600px;
            height:500px;
            position: absolute;
            top:0;
            right:0;
            bottom:0;
            left:0;
            margin: auto
        }
    </style>
</head>
<body>
   <img  src="../static/img/第二十条词云.jpg"/>
</body>
</html>

code11散点图

app.py新增

from pyecharts.charts import Scatter
import pyecharts.options as opts

@app.route("/scatter")
def scatter():
    # 读取 CSV 文件
    data = pd.read_csv("static/qingdao.csv",encoding='gbk')

    # 删除无用的列
    data = data.drop("Unnamed: 0", axis=1)

    # 获取面积和对应价格的列表
    area_list = data['houseSize'].to_list()
    price_list = data['total_price'].to_list()

    # 创建散点图
    scatter_plot = (
        Scatter()
        .add_xaxis(xaxis_data=area_list)
        .add_yaxis(
            series_name="青岛二手房面积价格散点图",
            y_axis=price_list,
            symbol_size=2,
            label_opts=opts.LabelOpts(is_show=False),
        )
        .set_series_opts()
        .set_global_opts(
            xaxis_opts=opts.AxisOpts(
                type_="value", name="面积/m2", splitline_opts=opts.SplitLineOpts(is_show=True)
            ),
            yaxis_opts=opts.AxisOpts(
                type_="value",
                name="总价/万",
                axistick_opts=opts.AxisTickOpts(is_show=True),
                splitline_opts=opts.SplitLineOpts(is_show=True),
            ),
            tooltip_opts=opts.TooltipOpts(is_show=False),
        )
        .render("templates/scatter.html")
    )

    return render_template("scatter.html")

散点图

code12 map

新增

from pyecharts.charts import Map
@app.route("/map")
def map():
    data = pd.read_csv("static/qingdao.csv",encoding='gbk')
    data = data.drop("Unnamed: 0", axis=1)
    data = data.drop(index=0)

    data_grouped = data.groupby('area')['unite_price'].mean().reset_index()
    result = [[value['area'], round(value['unite_price'] / 10000, 1)] for index, value in data_grouped.iterrows()]

    result[0][0] = '即墨市'
    result[1][0] = '城阳区'
    result[2][0] = '崂山区'
    result[3][0] = '市北区'
    result[4][0] = '市南区'
    result[5][0] = '平度市'
    result[6][0] = '李沧区'
    result[7][0] = '胶州市'
    result[8][0] = '莱西市'
    result[9][0] = '黄岛区'

    c = (
        Map()
        .add("青岛二手房均价", result, "青岛")
        .set_global_opts(
            title_opts=opts.TitleOpts(title="青岛地图"),
            visualmap_opts=opts.VisualMapOpts(min_=0, max_=4, is_piecewise=True),
        )
        .render("templates/map.html")
    )

    return render_template("map.html")

Code13 Pie

from pyecharts.charts import Pie
@app.route("/pie")
def pie():
    data = pd.read_csv("static/qingdao.csv",encoding='gbk')
    data = data.drop("Unnamed: 0", axis=1)

    temp = data.groupby("houseType")['area'].count().reset_index()
    list1 = [(value['houseType'], value['area']) for index, value in temp.iterrows()]

    list1 = sorted(list1, key=lambda x: x[1], reverse=True)[:10]

    c = (
        Pie()
        .add("", list1, radius=["30%", "75%"], center=["25%", "50%"], rosetype="radius",
             label_opts=opts.LabelOpts(is_show=False))
        .set_global_opts(title_opts=opts.TitleOpts(title="房屋类型数量", pos_top=80))
        .render("templates/pie.html")
    )

    return render_template("pie.html")

Code14 bar

from pyecharts.charts import Scatter, Bar
@app.route("/bar")
def bar():
    data =pd.read_csv("static/qingdao.csv",encoding="gbk")
    #删除无用的列
    data=data.drop("Unnamed: 0",axis=1)
    #print(data['position'].head(50))
    temp = data.groupby("position")["unite_price"].agg(['mean','count']).reset_index()
    #print(temp)

    result1=[ (value["position"],round(value['mean']/10000,1)) if value['count']>=3 else (0,0)  for _,value in temp.iterrows()]
    result1=sorted(result1,key=lambda x:x[1],reverse=True)[:10]
    #print(result1)
    c = (
        Bar()
        .add_xaxis([ item[0] for item in result1][::-1])
        .add_yaxis("二手房均价", [item[1] for item in result1][::-1])
        .reversal_axis()
        .set_series_opts(label_opts=opts.LabelOpts(position="right"))
        .set_global_opts(title_opts=opts.TitleOpts(title="青岛二手房均价最高的几个小区"),
                        tooltip_opts=opts.TooltipOpts(
                            formatter="{b}:{c}万元"
                        )
                        )
        .render("templates/bar.html")
    )
    return render_template("bar.html")

最后修改：2024 年 04 月 30 日

如果觉得我的文章对你有用，请随意赞赏

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

评论 *

私密评论

名称 *

🎲

邮箱 *

地址

阳光灿烂
我问小狗遇到心事怎么办，小狗说忘忘忘。
阳光灿烂
研表究明，汉字的序顺并不定一能影阅响读，比如当你看完这句话后，...
qrpxbutnkw
这篇文章不错！
riekozuuqu
这篇文章不错！
kijvmoxsgz
作者的情感表达细腻入微，让人在阅读中找到了心灵的慰藉。

第十周实训-部分代码

dayi • 2024 年 04 月 30 日

<h1>第十周实训</h1><blockquote>部分内容</blockquote><p>:::success<br>Yes :tada:<br>:::</p><h2>第一个代码</h2><pre><code class="lang-python"># 单行注释
'''
# 单行注释
'''
str=&quot;我是一只来自北方的狼&quot;
bnum=True
#复赋
com=2+1j
print(type(com))

if type(com)==complex:
    print(&quot;我是复数来着&quot;)

#列表    
list1 = [1,3,4,True,com,str]
for item in list1:
    print(item,&quot;***********************\n&quot;)
    
list1.append(&quot;哈哈哈 我是卖报的小行家&quot;)
#删除第一项
del list1[0]
print(list1)
#自增运算法，数据不能跨越类型，可以进行拼接
tub1 = (1,2,3,4,5,6,7)
tub2 = (&quot;a&quot;,&quot;b&quot;,&quot;c&quot;,&quot;d&quot;,&quot;e&quot;,&quot;f&quot;,&quot;g&quot;)
#tub = tub1+tub2
#tub1[0]=888
#print(tub)
[(1,&quot;a&quot;), (2,&quot;b&quot;), (3,&quot;c&quot;)]

list1 = [ item  for item in zip(tub1,tub2)]  
print(list1)</code></pre><p><img src="https://cmd.dayi.ink/uploads/upload_9c0b27016d74fec6d82a2755ca09e6f0.png#vwid=1855&vhei=1078" alt="" title=""style=""></p><pre><code class="lang-python"># 单行注释
'''
# 单行注释
'''
str = &quot;我是一只来自北方的狼&quot;
bnum = True
# 复赋
com = 2 + 1j
print(type(com))

if type(com) == complex:
    print(&quot;我是复数来着&quot;)

# 列表
list1 = [1, 3, 4, True, com, str]
for item in list1:
    print(item, &quot;***********************\n&quot;)

list1.append(&quot;哈哈哈 我是卖报的小行家&quot;)
# 删除第一项
del list1[0]
print(list1)
# 自增运算法，数据不能跨越类型，可以进行拼接
tub1 = (1, 2, 3, 4, 5, 6, 7)
tub2 = (&quot;a&quot;, &quot;b&quot;, &quot;c&quot;, &quot;d&quot;, &quot;e&quot;, &quot;f&quot;, &quot;g&quot;)
# tub = tub1+tub2
# tub1[0]=888
# print(tub)
[(1, &quot;a&quot;), (2, &quot;b&quot;), (3, &quot;c&quot;)]

list1 = [item for item in zip(tub1, tub2)]
print(list1)

list1 = [ item for item in zip(tub1,tub2)]

# 序列 作业
list2 = sorted(list1,key=lambda x:x[0],reverse=False)
print(list2)
#字典 使用对应Java Map类似  属性:属性值
dict1={
    &quot;name&quot;:&quot;古他那黑暗之神赵四&quot;,
    &quot;age&quot;:20,
    &quot;hobby&quot;:&quot;亚洲舞王之炸雷&quot;
}

print(list(dict1.keys()))
print(list(dict1.values()))
#集合
lis3  =[{
    'name':'尼古拉嘶赵四',
    'age':60,
    &quot;hobby&quot;:&quot;亚洲舞王之炸雷&quot;

},{
    &quot;name&quot;:&quot;最强最强妖王谢广坤&quot;,
    &quot;age&quot;:62,
    &quot;hobby&quot;:&quot;作妖&quot;,
},{
    &quot;name&quot;:&quot;迈克尔刘能&quot;,
    &quot;age&quot;:60,
    &quot;hobby&quot;:&quot;烫头&quot;}
]

import csv
#将数据库写入到表格
#写入字符串 模式 wb写入字节码 ，会覆盖原来的数据
#a 追加模式,念在末尾添加的数据,不会覆盖
#r读入模式 rb读入学节码
with open(&quot;infor.csv&quot;,&quot;w&quot;,newline=&quot;&quot;,encoding=&quot;utf-8&quot;) as f:
  #获取写入器
  write = csv.DictWriter(f,fieldnames=[&quot;name&quot;,&quot;age&quot;,&quot;hobby&quot;])
  write.writerows(lis3)

with open(&quot;infor.csv&quot;,&quot;r&quot;,encoding=&quot;utf-8&quot;) as f:
  fread = csv.DictReader(f,fieldnames=[&quot;name&quot;,&quot;age&quot;,&quot;hobby&quot;])
  print(&quot;*****************************************&quot;)
  for item in fread:
    print(item)</code></pre><p><img src="https://cmd.dayi.ink/uploads/upload_f3a292b1edb03d051a5ea1157e97d29b.png#vwid=924&vhei=358" alt="" title=""style=""></p><p><img src="https://cmd.dayi.ink/uploads/upload_16bc8c9da703f15735823b5cea19c034.png#vwid=1920&vhei=1013" alt="" title=""style=""></p><h2>第二个代码</h2><pre><code class="lang-python">def difNum(list1):
    for item1 in list1:
        for item2 in list1:
            if item1 != item2:
                list2.append(&quot;%d%d&quot; % (item1, item2))

for item3 in list2:
        if item3 not in list3:
            list3.append(item3)

print(list3)

# 构建一组数，一个数的两位不重复，数之间也不重复
list1 = [1, 2, 3, 4, 6, 7, 8, 8, 9, 9, 5, 3]
list2 = []  # 用来装载中间变量的列表
list3 = []  # 最终去除重复的列表
difNum(sorted(list1))</code></pre><p><img src="https://cmd.dayi.ink/uploads/upload_80d466bc2a86c5d6aa0d067a51d174f4.png#vwid=1633&vhei=678" alt="" title=""style=""></p><h2>code3 类继承</h2><p><img src="https://cmd.dayi.ink/uploads/upload_ac8200ec26b9b59e5a79a8c52f881528.png#vwid=1918&vhei=1725" alt="" title=""style=""></p><pre><code class="lang-python">class Person:
    name=&quot;人类&quot;
    age=20

# 初始化函数
    # 父类独有的属性子类不能继承
    __priMoney=5000
    def __init__(self):
        self.name = &quot;小明&quot;
        self.age = 40

#动态函数
    def MyPrint(self):
        print(self.name,f&quot;{self.age}了，大龄剩男&quot;,)
        return &quot;搞钱吧，别想别的，你已经不是充钱的少年了&quot;

#构析函数
    def __del__(self):
        print(&quot;end_Person_class&quot;)

class Mother:
    def fly(self):
        print(&quot;会飞翔&quot;)

class Child(Person,Mother):
    name = &quot;小强&quot;
    age = 18
    # def __init__(self):
    #    self.name = &quot;小量&quot;
    #    self.age = 17
    __priMoney = 1000
    # 定义类的函数
    def SayHello(self):
        print(&quot;你好,我是{0},我今年{1}岁了&quot;.format(self.name, self.age))
    def MyPrint(self):
        print(&quot;我是子类的输出函数&quot;)
        print(self.name, &quot;{}了,人够男的&quot;.format(self.age))
        return &quot;愉快吧,别想别的,你已经不是充钱的少年了&quot;

def priv_money(self):
        print(&quot;私房钱剩余&quot;,self.__priMoney)

pass

if __name__==&quot;__main__&quot;:
    cc = Child()
    cc.SayHello()
    cc.MyPrint()
    cc.fly()
    cc.priv_money()</code></pre><h2>code4 豆瓣爬虫</h2><h3>镜像源</h3><blockquote>快下但是好像pycharm不是很喜欢。卡卡的</blockquote><p>北外(ustc跳转)镜像源:<span class="external-link"><a class="no-external-link" href="https://mirrors.ustc.edu.cn/pypi/web/simple" target="_blank"><i data-feather="external-link"></i>https://mirrors.ustc.edu.cn/pypi/web/simple</a></span></p><p><img src="https://cmd.dayi.ink/uploads/upload_6bc52b5ccae31799aede93edb5393966.png#vwid=1837&vhei=462" alt="" title=""style=""></p><p>或者直接通过<code>pip install requests beautifulsoup4 bs4 -i https://mirrors.ustc.edu.cn/pypi/web/simple</code>安装</p><p><img src="https://cmd.dayi.ink/uploads/upload_f750d86a22f1dc1ce631924530af79b1.png#vwid=1830&vhei=1149" alt="" title=""style=""></p><h3>代码</h3><pre><code class="lang-python"># 获取请求,给远程服务器发送信息 获取数据
import requests
# 网页都是标签组成的,标签之间有嵌套,BeautifulSoup把标签层级化,可以通过内部方法,找到标签属性,和文字
from bs4 import BeautifulSoup
import lxml
import time

url = 'https://movie.douban.com/subject/36208094/comments?status=P'

# 浏览器头部伪装
headers = {
    &quot;User-Agent&quot;: &quot;Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36&quot;,
    &quot;Host&quot;: &quot;movie.douban.com&quot;,
    &quot;Cookie&quot;: &quot;ll='108302'; bid=UNCukvvPqR8; __pk_id.100001.4cf6=ba0528c5b4d17da0.1704161561.; __yadk_uid=NAiBkhl9crL0ghh6yzHiXUPk&quot;
}

# 获取豆瓣浏览器的响应信息
resp = requests.get(url=url, headers=headers)
print(resp.status_code)
# print(resp.text)

# 解析网页源码
bs = BeautifulSoup(resp.content, &quot;lxml&quot;)

# 先找到所有的div class='comment-item'
divs = bs.find_all(&quot;div&quot;, attrs={&quot;class&quot;: &quot;comment-item&quot;})
# print(divs)

for item in divs:
    # 当前的item是每个昵称下的评论块
    review = item.find(&quot;span&quot;, attrs={&quot;class&quot;: &quot;short&quot;}).text
    print(&quot;*********************************&quot;)
    print(review)

nickname = item.find(&quot;span&quot;, attrs={&quot;class&quot;: &quot;comment-info&quot;}).find(&quot;a&quot;).text
    # 输出昵称
    print(nickname)

score_tag = item.find(&quot;span&quot;, attrs={&quot;class&quot;: &quot;rating&quot;})
    if score_tag:
        score = score_tag['title']
        print(score)
    else:
        print(&quot;No rating found&quot;)</code></pre><p><img src="https://cmd.dayi.ink/uploads/upload_a1e8af18620fb78ab4cf79a073b1aa08.png#vwid=1920&vhei=1150" alt="" title=""style=""></p><h3>code5 爬虫爬多页</h3><pre><code class="lang-python">
# 获取请求,给远程服务器发送信息 获取数据
import requests
# 网页都是标签组成的,标签之间有嵌套,BeautifulSoup把标签层级化,可以通过内部方法,找到标签属性,和文字
from bs4 import BeautifulSoup
import lxml
import time

# 装载所有数据的列表
list = []

for i in range(10):
    try:
        time.sleep(1)
        url = f&quot;https://movie.douban.com/subject/36208094/comments?start={i * 20}&amp;limit=20&amp;status=P&amp;sort=new_score&quot;
        # 获取豆瓣浏览器的响应信息
        resp = requests.get(url=url, headers=headers)
        print(resp.status_code)
        # print(resp.text)

# 解析网页源码
        bs = BeautifulSoup(resp.content, &quot;lxml&quot;)
        # 先找到所有的div class='comment-item'
        divs = bs.find_all(&quot;div&quot;, attrs={&quot;class&quot;: &quot;comment-item&quot;})
        # print(divs)

for item in divs:
            dict1 = {}
            # 当前的item是每个昵称下的评论块
            review = item.find(&quot;span&quot;, attrs={&quot;class&quot;: &quot;short&quot;}).text
            print(&quot;*********************************&quot;)
            print(review)

nickname = item.find(&quot;span&quot;, attrs={&quot;class&quot;: &quot;comment-info&quot;}).find(&quot;a&quot;).text
            # 输出昵称
            print(nickname)

score_tag = item.find(&quot;span&quot;, attrs={&quot;class&quot;: &quot;rating&quot;})
            if score_tag:
                score = score_tag['title']
                print(score)
            else:
                score = &quot;No rating found&quot;

dict1['nickname'] = nickname
            dict1['review'] = review
            dict1['score'] = score
            list.append(dict1)

except Exception as e:
        print(&quot;出现了异常了&quot;, e)
        # 这条忽略去下一条
        continue

import csv

print(&quot;总数据是&quot;, list)

# 爬取数据,并且将数据写入到第二十条.csv
with open(&quot;第二十条.csv&quot;, &quot;w&quot;, newline=&quot;&quot;, encoding=&quot;utf-8&quot;) as f:
    # 获取写入器
    fwrite = csv.DictWriter(f, fieldnames=[&quot;nickname&quot;, &quot;review&quot;, &quot;score&quot;])
    fwrite.writerows(list)</code></pre><p><img src="https://cmd.dayi.ink/uploads/upload_c1af891079fdb8fbcf72b175afabe4f8.png#vwid=1920&vhei=1150" alt="" title=""style=""></p><p><img src="https://cmd.dayi.ink/uploads/upload_fd9387cf09e767fc064a3efb15a5b111.png#vwid=1920&vhei=1150" alt="" title=""style=""></p><h2>code6 词云1</h2><pre><code class="lang-python">#pandas做逻辑清洗
import pandas as pd
from wordcloud import WordCloud
#将彩色图片转化为数字,numpy进行矩阵运算
import numpy as np
#Image.open可以将图片导入到内存当中
from PIL import Image

#测试图片导入python内存中
image = np.array(Image.open(&quot;image/111.jpg&quot;))
#print(image)

#通过pandas直接读取csv文件
data = pd.read_csv('第二十条.csv', names=['nickname','review','score'])
#将所有的评论放到一个列表
listCom1 = data['review'].tolist()

#可以将词语中的主谓宾提炼出来
import jieba
#切分词云,join(listCom1)将列表转化为字符串
listCom2 = jieba.lcut(&quot;,&quot;.join(listCom1))
#strWord = &quot;&quot;.join(listCom2)
list2 = []
for item in listCom2:
    #print(item)
    if len(item) &gt; 1:  # 只保留长度大于1的词
        list2.append(item)

#统计哪些词语出现的频率比较高
import collections
#统计各个词语频率
word_fre = collections.Counter(list2)
print(word_fre)

# 生成词云
wc = WordCloud(
    background_color='white',
    mask=image,
    font_path='font/SourceHanSansHWSC-Bold.otf',  # 设置中文字体
    max_words=1000,  # 最多显示词数
    max_font_size=300  # 最大字号
)
wc.generate_from_frequencies(word_fre)
wc.to_file('词云.jpg')  # 保存词云图片</code></pre><p><img src="https://cmd.dayi.ink/uploads/upload_b1c55a517cae02173a9e0bd5b4f56f95.png#vwid=1920&vhei=1150" alt="" title=""style=""></p><p><img src="https://cmd.dayi.ink/uploads/upload_c1f8b7213252bba8bbe0c1eb4e2bfd5e.png#vwid=1920&vhei=1150" alt="" title=""style=""></p><h2>code7 词云2</h2><p>去掉语气词</p><p><img src="https://cmd.dayi.ink/uploads/upload_0316df1b2356f1b67fd54438997459b7.png#vwid=1920&vhei=1150" alt="" title=""style=""></p><p><img src="https://cmd.dayi.ink/uploads/upload_d0414da2359fdb30b16db22cd4b03c4c.png#vwid=1920&vhei=1150" alt="" title=""style=""></p><pre><code class="lang-python">#pandas做逻辑清洗
import pandas as pd
from wordcloud import WordCloud
#将彩色图片转化为数字,numpy进行矩阵运算
import numpy as np
#Image.open可以将图片导入到内存当中
from PIL import Image

#测试图片导入python内存中
image = np.array(Image.open(&quot;image/111.jpg&quot;))
#print(image)

#通过pandas直接读取csv文件
data = pd.read_csv('第二十条.csv', names=['nickname','review','score'])
#将所有的评论放到一个列表
listCom1 = data['review'].tolist()

#统计哪些词语出现的频率比较高
import collections
#统计各个词语频率

list3= [ ]

filter_word = [',', '的', '。', '了', '是', '我', '很', '在', '', '电影']

for word in list2:
    if word in filter_word:
        continue
    if len(word) &gt; 1:
        list3.append(word)
word_fre = collections.Counter(list3)
print(word_fre)

# 生成词云
# 生成词云
wc = WordCloud(
    background_color='white',
    mask=image,
    font_path='font/SourceHanSansHWSC-Bold.otf',  # 设置中文字体
    max_words=1000,  # 最多显示词数
    max_font_size=300  # 最大字号
)
wc.generate_from_frequencies(word_fre)
wc.to_file('第二十条词云.jpg')  # 保存词云图片</code></pre><h2>code 8 flask</h2><p><img src="https://cmd.dayi.ink/uploads/upload_b5b86646c5ef5e95d2d59130b0c82abd.png#vwid=1915&vhei=1155" alt="" title=""style=""></p><pre><code class="lang-python">from flask import Flask, render_template, request

app = Flask(__name__)

# 默认路径的处理函数(路由)
@app.route(&quot;/&quot;)
def home():
    return &quot;&lt;h1 style='color:red'&gt;今天天气有点热，吃不进饭&lt;/h1&gt;&quot;

@app.route(&quot;/index&quot;)
def index():
    return render_template('index.html')

# 启动 Flask 服务器
if __name__ == &quot;__main__&quot;:
    app.run(port=9999, debug=True)</code></pre><h2>code 9 index.html</h2><pre><code>&lt;!DOCTYPE html&gt;
&lt;html lang=&quot;en&quot;&gt;
&lt;head&gt;
    &lt;meta charset=&quot;UTF-8&quot;&gt;
    &lt;title&gt;Title&lt;/title&gt;
    &lt;style&gt;
        img {
            width:600px;
            height:500px;
            position: absolute;
            top:0;
            right:0;
            bottom:0;
            left:0;
            margin: auto
        }
    &lt;/style&gt;
&lt;/head&gt;
&lt;body&gt;
   &lt;img  src=&quot;../static/img/第二十条词云.jpg&quot;/&gt;
&lt;/body&gt;
&lt;/html&gt;</code></pre><p><img src="https://cmd.dayi.ink/uploads/upload_2925b736fe1916cc866d8078c1faf092.png#vwid=1920&vhei=1150" alt="" title=""style=""></p><p><img src="https://cmd.dayi.ink/uploads/upload_e0e3409e6a0573bd307354a5f1cccd9e.png#vwid=1348&vhei=656" alt="" title=""style=""></p><p><img src="https://cmd.dayi.ink/uploads/upload_816cc2aa786dd4c7e635fa554a366238.png#vwid=1917&vhei=911" alt="" title=""style=""></p><h2>code 10 复制下文件</h2><p>压缩包解压拖过去就可以</p><p><img src="https://cmd.dayi.ink/uploads/upload_8ed625ad4659da35c95aff5dc859fc1b.png#vwid=1920&vhei=1013" alt="" title=""style=""></p><p>app.py</p><pre><code class="lang-python">from flask import Flask, render_template, request

app = Flask(__name__)

# 默认路径的处理函数(路由)
@app.route(&quot;/&quot;)
def home():
    return render_template(&quot;index.html&quot;)

@app.route(&quot;/welcome&quot;)
def welcome():
    return render_template(&quot;welcome.html&quot;)

@app.route(&quot;/wordcloud&quot;)
def wordcloud():
    # Assuming wordcloud.html is a valid template
    return render_template(&quot;wordcloud.html&quot;)

# 启动 Flask 服务器
if __name__ == &quot;__main__&quot;:
    app.run(port=9999, debug=True)
</code></pre><p>fix:</p><p><img src="https://cmd.dayi.ink/uploads/upload_7cfa3fda932fd9e605d328f1d64b59bc.png#vwid=1171&vhei=681" alt="" title=""style=""></p><p><img src="https://cmd.dayi.ink/uploads/upload_886b8b1fab870575af868cc554875662.png#vwid=1056&vhei=551" alt="" title=""style=""></p><p>wordcloud_html：</p><pre><code>&lt;!DOCTYPE html&gt;
&lt;html lang=&quot;en&quot;&gt;

&lt;head&gt;
    &lt;meta charset=&quot;UTF-8&quot;&gt;
    &lt;title&gt;Title&lt;/title&gt;
    &lt;style&gt;
        img {
            width:600px;
            height:500px;
            position: absolute;
            top:0;
            right:0;
            bottom:0;
            left:0;
            margin: auto
        }
    &lt;/style&gt;
&lt;/head&gt;
&lt;body&gt;
   &lt;img  src=&quot;../static/img/第二十条词云.jpg&quot;/&gt;
&lt;/body&gt;
&lt;/html&gt;</code></pre><p><img src="https://cmd.dayi.ink/uploads/upload_bac8669ffef23449281825a12fb74245.png#vwid=1919&vhei=1114" alt="" title=""style=""></p><h2>code11散点图</h2><p>app.py新增</p><pre><code class="lang-python">from pyecharts.charts import Scatter
import pyecharts.options as opts

@app.route(&quot;/scatter&quot;)
def scatter():
    # 读取 CSV 文件
    data = pd.read_csv(&quot;static/qingdao.csv&quot;,encoding='gbk')

# 删除无用的列
    data = data.drop(&quot;Unnamed: 0&quot;, axis=1)

# 获取面积和对应价格的列表
    area_list = data['houseSize'].to_list()
    price_list = data['total_price'].to_list()

# 创建散点图
    scatter_plot = (
        Scatter()
        .add_xaxis(xaxis_data=area_list)
        .add_yaxis(
            series_name=&quot;青岛二手房面积价格散点图&quot;,
            y_axis=price_list,
            symbol_size=2,
            label_opts=opts.LabelOpts(is_show=False),
        )
        .set_series_opts()
        .set_global_opts(
            xaxis_opts=opts.AxisOpts(
                type_=&quot;value&quot;, name=&quot;面积/m2&quot;, splitline_opts=opts.SplitLineOpts(is_show=True)
            ),
            yaxis_opts=opts.AxisOpts(
                type_=&quot;value&quot;,
                name=&quot;总价/万&quot;,
                axistick_opts=opts.AxisTickOpts(is_show=True),
                splitline_opts=opts.SplitLineOpts(is_show=True),
            ),
            tooltip_opts=opts.TooltipOpts(is_show=False),
        )
        .render(&quot;templates/scatter.html&quot;)
    )

return render_template(&quot;scatter.html&quot;)
</code></pre><p>散点图</p><p><img src="https://cmd.dayi.ink/uploads/upload_29addb2a2f38b946a2d47e5da8e0591a.png#vwid=1919&vhei=1070" alt="" title=""style=""></p><h2>code12 map</h2><p>新增</p><pre><code class="lang-python">from pyecharts.charts import Map
@app.route(&quot;/map&quot;)
def map():
    data = pd.read_csv(&quot;static/qingdao.csv&quot;,encoding='gbk')
    data = data.drop(&quot;Unnamed: 0&quot;, axis=1)
    data = data.drop(index=0)

data_grouped = data.groupby('area')['unite_price'].mean().reset_index()
    result = [[value['area'], round(value['unite_price'] / 10000, 1)] for index, value in data_grouped.iterrows()]

result[0][0] = '即墨市'
    result[1][0] = '城阳区'
    result[2][0] = '崂山区'
    result[3][0] = '市北区'
    result[4][0] = '市南区'
    result[5][0] = '平度市'
    result[6][0] = '李沧区'
    result[7][0] = '胶州市'
    result[8][0] = '莱西市'
    result[9][0] = '黄岛区'

c = (
        Map()
        .add(&quot;青岛二手房均价&quot;, result, &quot;青岛&quot;)
        .set_global_opts(
            title_opts=opts.TitleOpts(title=&quot;青岛地图&quot;),
            visualmap_opts=opts.VisualMapOpts(min_=0, max_=4, is_piecewise=True),
        )
        .render(&quot;templates/map.html&quot;)
    )

return render_template(&quot;map.html&quot;)
</code></pre><p><img src="https://cmd.dayi.ink/uploads/upload_89320a3312201aab8fb9affaeedc5a4c.png#vwid=1920&vhei=1150" alt="" title=""style=""></p><h2>Code13 Pie</h2><pre><code class="lang-python">from pyecharts.charts import Pie
@app.route(&quot;/pie&quot;)
def pie():
    data = pd.read_csv(&quot;static/qingdao.csv&quot;,encoding='gbk')
    data = data.drop(&quot;Unnamed: 0&quot;, axis=1)

temp = data.groupby(&quot;houseType&quot;)['area'].count().reset_index()
    list1 = [(value['houseType'], value['area']) for index, value in temp.iterrows()]

list1 = sorted(list1, key=lambda x: x[1], reverse=True)[:10]

c = (
        Pie()
        .add(&quot;&quot;, list1, radius=[&quot;30%&quot;, &quot;75%&quot;], center=[&quot;25%&quot;, &quot;50%&quot;], rosetype=&quot;radius&quot;,
             label_opts=opts.LabelOpts(is_show=False))
        .set_global_opts(title_opts=opts.TitleOpts(title=&quot;房屋类型数量&quot;, pos_top=80))
        .render(&quot;templates/pie.html&quot;)
    )

return render_template(&quot;pie.html&quot;)

</code></pre><p><img src="https://cmd.dayi.ink/uploads/upload_b685b80a4e3e7963bf3afab5fa85e6f1.png#vwid=1881&vhei=973" alt="" title=""style=""></p><h2>Code14 bar</h2><pre><code class="lang-python">from pyecharts.charts import Scatter, Bar
@app.route(&quot;/bar&quot;)
def bar():
    data =pd.read_csv(&quot;static/qingdao.csv&quot;,encoding=&quot;gbk&quot;)
    #删除无用的列
    data=data.drop(&quot;Unnamed: 0&quot;,axis=1)
    #print(data['position'].head(50))
    temp = data.groupby(&quot;position&quot;)[&quot;unite_price&quot;].agg(['mean','count']).reset_index()
    #print(temp)

result1=[ (value[&quot;position&quot;],round(value['mean']/10000,1)) if value['count']&gt;=3 else (0,0)  for _,value in temp.iterrows()]
    result1=sorted(result1,key=lambda x:x[1],reverse=True)[:10]
    #print(result1)
    c = (
        Bar()
        .add_xaxis([ item[0] for item in result1][::-1])
        .add_yaxis(&quot;二手房均价&quot;, [item[1] for item in result1][::-1])
        .reversal_axis()
        .set_series_opts(label_opts=opts.LabelOpts(position=&quot;right&quot;))
        .set_global_opts(title_opts=opts.TitleOpts(title=&quot;青岛二手房均价最高的几个小区&quot;),
                        tooltip_opts=opts.TooltipOpts(
                            formatter=&quot;{b}:{c}万元&quot;
                        )
                        )
        .render(&quot;templates/bar.html&quot;)
    )
    return render_template(&quot;bar.html&quot;)</code></pre><p><img src="https://cmd.dayi.ink/uploads/upload_e5ad8c1b0590124f879b8e53fb299169.png#vwid=1920&vhei=1150" alt="" title=""style=""></p>

第十周实训-部分代码

第十周实训

第一个代码

第二个代码

code3 类继承

code4 豆瓣爬虫

镜像源

代码

code5 爬虫爬多页

code6 词云1

code7 词云2

code 8 flask

code 9 index.html

code 10 复制下文件

code11散点图

code12 map

Code13 Pie

Code14 bar

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

友情链接！

win server 2022 开机自动登录

CTF 练习 22.2.1

[排坑|流程简化]物理实验使用方法

Linux期末作业解析_vmware版

Nginx Mixed_content 错误

SDN ryu的安装

计算机组成原理1——认识logisim软件、门电路逻辑功能测试

debian使用netselect选择最快节点

SDN作业2 Open vSwitch 应用实践1

第十周实训-部分代码

第十周实训

第一个代码

第二个代码

code3 类继承

code4 豆瓣爬虫

镜像源

代码

code5 爬虫爬多页

code6 词云1

code7 词云2

code 8 flask

code 9 index.html

code 10 复制下文件

code11散点图

code12 map

Code13 Pie

Code14 bar

发表评论 取消回复 使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

第十周实训-部分代码

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款