爬虫获取19年4季度天天基金网基金持仓并进行可视化分析(上)

时间:2022-09-04 12:27:09 | 浏览:3690

目的通过爬取基金持仓信息,我们可以了解基金的资金流向,说白了,就是知道大型基金公司都买了什么股票,买了多少。也可以跟踪一些知名的基金,看看他们都买了什么股票,从而跟买或者不买,估值便宜的股票,又有很多基金入场,很可能这家公司大家都非常看好,

目的

通过爬取基金持仓信息,我们可以了解基金的资金流向,说白了,就是知道大型基金公司都买了什么股票,买了多少。也可以跟踪一些知名的基金,看看他们都买了什么股票,从而跟买或者不买,估值便宜的股票,又有很多基金入场,很可能这家公司大家都非常看好,未来业绩很可能增长,可能是一次比较好的投资机会;而有些股票,估值已经很高了,里边还有很多的基金公司,这就需要注意了,很可能基本面发生一点点恶化,或者达不到预期,基金公司可能就会大幅的抛售,导致股价大跌。

本文分上、下两个部分。

第一部分,讲解如何爬取数据并存储到mysql数据库。

第二部分,对爬取出来的数据进行可视化分析。

1分析要爬取的网页数据

需要获取所有的基金代码

http://fund.eastmoney.comllfund.html


with open("test.html", "w", encoding="utf-8") as f: f.write(driver.page_source) time.sleep(1) file = open("test.html", "r", encoding="utf-8") soup = BeautifulSoup(file, "lxml") driver.quit() try: fund = soup.select("#bodydiv > div > div > div.basic-new > div.bs_jz > div.col-left > h4 > a")[0].get_text() scale = soup.select("#bodydiv > div > div.r_cont > div.basic-new > div.bs_gl > p > label > span")[2].get_text().strip().split()[0] table = soup.select("#cctable > div > div > table") trs = table[0].select("tbody > tr") for tr in trs: code = tr.select("td > a")[0].get_text() name = tr.select("td > a")[1].get_text() price = tr.select("td > span")[0].get_text() try: round(float(price), 2) except ValueError: price = 0 num = tr.select("td.tor")[3].get_text() market = float(num.replace(",", "")) * float(price) data = { "crawl_date": today, "code": code, "fund": fund.split(" (")[0], "scale": scale, "name": name, "price": round(float(price), 2), "num": round(float(num.replace(",", "")), 2), "market_value": round(market, 2) } data=pd.DataFrame([data]) insert_sql(data) except IndexError: info = { "url": url } print(info)

获取所有的基金代码,循环调用get_info

def get_code(url):
    html = requests.get(url, headers=headers)
    html.encoding = "gbk"
    document = etree.HTML(html.text)
    info = document.xpath("// *[ @ id = "code_content"] / div / ul / li / div / a[1] /text()")
    i = 0
    for fund in info:
        str = fund.split(")")[0]
        code = str.split("(")[1]
        url = "http://fundf10.eastmoney.com/ccmx_%s.html" % code
        get_info(url)


if __name__ == "__main__":
    found_url = "http://fund.eastmoney.comllfund.html"
    get_code(found_url)

好了,4段简单的代码就可以讲天天基金网里的数据都爬取到数据库里了。

下次给大家讲解如何用爬到的数据做可视化分析。

谢谢关注

相关资讯

华富基金调研图南股份

公司主营高温合金、特种不锈钢等高性能合金材料及其制品的研产销,产品广泛应用在包含航空发动机、燃气轮机、核电装备等军用及高端民用领域,是国内飞机、航空发动机用高温合金和不锈钢无缝管的主要供应商。证券之星力求但不保证该信息(包括但不限于文字、视频、音频、数据及图表)全部或者部分内容的的准确性、完整性、有效性、及时性等,如存在问题请联系我们。

全球最大主权财富基金上半年亏超1.1万亿元

报告显示,上半年,全球回报率为-144%,相当于亏损16800亿挪威克朗,折合人民币约11760亿元。截至6月30日,挪威政府全球养老基金管理规模为116570亿挪威克朗,折合人民币约81599亿元。

十倍基金都长啥样?你买到过吗?这里有你想知道的答案

据通联数据Datayes统计结果显示,截至2022年8月9日,共有45只基金符合这个标准。据通联数据Datayes监测结果显示,所有45只十倍基金自成立以来,年化收益率均达到了两位数。此外,年化收益率达到20以上的还有兴全趋势投资混合(LOF),其年化收益率为2079。

汇丰晋信基金吴培文:打造简明易用的投资框架理念

中国基金报记者曹雯璟国内有很多价值投资者,都把巴菲特理念作为投资指导,这几年也出现不少成长理念的投资者。但市场现实让他们普遍困惑:为什么自己秉持的这些很有道理的投资策略会失效呢?汇丰晋信策略优选混合基金拟任基金经理吴培文认为,投资策略和投

机构投资方向明确,资金借道ETF入市,医药基金获青睐丨基金下午茶

一、要闻速递1.半导体、医药ETF 上周资金净流入居前上周,A股ETF表现分化,电力、光伏相关ETF涨幅居前,广发中证全指电力公用事业ETF上涨6.23%,华泰柏瑞中证全指电力公用事业ETF上涨5.89%,博时中证全指电力公用事业ETF上涨

8月22日中望软件跌8.42%,兴全合润混合(LOF)基金重仓该股

8月22日中望软件(688083)跌8.42%,收盘报197.8元,换手率2.21%,成交量0.99万手,成交额1.97亿元。该股为国产软件概念热股。资金流向数据方面,8月22日主力资金净流出1152.1万元,游资资金净流出859.66万元。

天天基金上半年靠卖基金净利润过亿

报告显示, 天天基金网上半年实现营业收入22.07亿元,净利润为1.02亿元。记者 杜萌8月12日,东方财富(300059.SZ)披露半年度报告,基金代销巨头天天基金上半年的营收情况也得以披露。去年全年,天天基金营业收入达到50.81亿。

设立2亿科创基金支持成果转化开封为河大科创中心提供2万平方米科研基地

大河网讯(记者 朱丽文 赵檬)9月26日,“河南这十年”主题系列开封专场新闻发布会召开,重点介绍党的十八大以来开封的经济社会发展情况,并就有关问题回答记者提问。发布会上,开封市委副书记、市人民政府市长李湘豫介绍,创新是引领发展的第一动力。在

基金早班车|资金加仓茅台、五粮液、泸州老窖等白酒龙头,前三季混合基金平均收益率-15.17%

一、交易提示1.2022年前三季度股票型基金平均收益率-21.61%,混合型基金平均收益率-15.17%,只有不到一成的股票型和混合型基金实现正收益。从前三季度单个主动权益类基金表现来看,万家基金黄海一人独揽冠亚季军。其中,万家宏观择时多策

“自购潮”再启背后:今年已有超百家基金公司出手,这只被自购的基金年内收益超20%,可以抄作业吗?

基金公司“自购潮”来了!18日早间,博时基金发布公告,将于近日运用固有资金合计1亿元人民币投资旗下权益类公募基金。而就在前一天(17日),多家基金公司同样宣布了将大手笔回购旗下基金。易方达基金1.5亿元、广发基金1亿元、汇添富基金1亿元、南

友情链接

天天财经元宇宙中国SEO域名抢注宝宝起名网网站监控妈妈知道时尚女性网南宁交友相亲网翻译在线网站无人机航拍网奶茶培训网特斯拉美股行情电竞游戏网张杰歌迷网维多利亚旅游网周易起名网三明今日新闻网高空跳伞运动网武汉新闻头条网手工艺术品官网羽毛球运动网
“基金”全称为证券投资基金,是通过发售基金份额,将众多投资者的资金集中起来,形成独立资产,由基金托管托管,基金管理人管理,以投资组合的方法进行证券投资的一种利益共享、风险共担的集合投资方式。
天天基金资讯网 lulule.cc©2022-2028版权所有