在前面几篇博客我们记录了python的一些简单语法,主要偏向于理论。俗话说站在岸上学不会游泳,所有从今天开始我们将要进入python学习的新征程---实战篇。我们会在实战篇中穿插一些基础知识,或初识,或温故知新,将我们的基础慢慢打牢。
今天我们的主题是构建虚拟环境,初识pip以及初步使用beautiful soup包。
首先我们来了解一下什么是虚拟环境以及为什么要使用虚拟环境?我们先来假设一个场景,如果我们使用了一个第三方的包,且是全局的,开始项目A和B都使用了这个包,某一天这个包升级了,A项目还可以运行,但是不幸的是B项目不兼容了,此时你就非常操蛋了(保大还是保小?)!。当然了,python是不会让你面临这种尴尬的局面的,有种解决方案就是建立虚拟环境。pyhton虚拟环境允许Python包安装在特定应用程序的隔离位置,而不是在全局安装。它们有自己的安装目录,并且不与其他虚拟环境共享库。这点在实际开发中非常重要!详细可以看官网:Installing Packages — Python Packaging User Guide
构建虚拟环境了解了虚拟环境我们来尝试构建一个虚拟环境吧(可以使用编辑器创建,也可以使用cmd命令行的方式创建,此处使用cmd命令行的方式)。
1)、先建立一个文件夹,此文件夹专门存放pyhton虚拟环境,因为可能会需要很多虚拟环境,如D:mypythonpyvenv
2)、在cmd(windows系统)命令行,cd到D:mypythonpyvenv,然后输入命令行python -m venv test,如下所示
此时我们进入该目录下查看,发现里面有很多文件夹,
3 )、cmd环境下,我们进入Scripts文件夹下,运行activate.bat(linux系统下我们运行activate脚本)
注意此时如果成功的话是会有evn标志的,如下所示,前面是有(test)标志的,这个表示你当前是处于沙盒环境的。
安装第三方库虚拟环境构建成功之后我们接下来要做的就是安装第三方包了,比如我们要试玩爬虫,可以安装beautiful soup包。(可查看中文文档Beautiful Soup 4.4.0 文档 — beautifulsoup 4.4.0q 文档)此时我们需要用到一个工具pip。这个我们可以简单理解成java中的maven或者gradle(不知道对不对哈,不对的话求指教)。如上图,我们仍然在D:mypythonpyvenv estScripts目录下使用命令pyhton -m pip install beautifulsoup4稍候片刻就会提示安装完成,此时我们打开D:mypythonpyvenv estLibsite-packages目录下,发现已经安装完成。
试运行此处使用的的pycharm,打开编辑器setting,选择虚拟环境,如下截图
运行代码,如下截图,可以发现我们的测试网页html的头部被获取到了。
【Python实现网络爬虫】Scrapy爬取网易新闻(仅供学习交流使用!)