<thead id="xthz1"></thead>
            <form id="xthz1"></form>

                <sub id="xthz1"><meter id="xthz1"></meter></sub><thead id="xthz1"><meter id="xthz1"></meter></thead>

                <thead id="xthz1"><meter id="xthz1"></meter></thead>

                <th id="xthz1"></th>

                  <font id="xthz1"><meter id="xthz1"><i id="xthz1"></i></meter></font>

                          <nobr id="xthz1"><meter id="xthz1"></meter></nobr>

                          <th id="xthz1"><meter id="xthz1"></meter></th>

                          <nobr id="xthz1"></nobr>

                                  <nobr id="xthz1"><meter id="xthz1"><var id="xthz1"></var></meter></nobr>

                                  <th id="xthz1"></th>
                                  <thead id="xthz1"><meter id="xthz1"><b id="xthz1"></b></meter></thead>
                                  
                                  

                                      <pre id="xthz1"><noframes id="xthz1"><track id="xthz1"></track>

                                          <nobr id="xthz1"><meter id="xthz1"><var id="xthz1"></var></meter></nobr>

                                          <th id="xthz1"></th>

                                            <address id="xthz1"></address>

                                            <thead id="xthz1"><meter id="xthz1"></meter></thead>

                                                <video id="xthz1"><span id="xthz1"><nobr id="xthz1"></nobr></span></video>

                                                  <th id="xthz1"><meter id="xthz1"></meter></th>

                                                  <th id="xthz1"></th>

                                                    <th id="xthz1"></th><track id="xthz1"><meter id="xthz1"></meter></track>

                                                      <font id="xthz1"><meter id="xthz1"></meter></font><th id="xthz1"><meter id="xthz1"></meter></th>

                                                          <sub id="xthz1"><progress id="xthz1"></progress></sub>

                                                              <sub id="xthz1"></sub>

                                                                          <track id="xthz1"><meter id="xthz1"></meter></track>
                                                                              當前位置 > 首頁 > 技術文檔 > Pandas入門

                                                                              Pandas入門

                                                                              來源:CPDA數據分析師學習網 | 時間:2018-02-09 | 作者:數據分析學習網

                                                                              作為從事數據相關工作的我們,平時接觸的更多的是一張有板有眼的數據表格,在這里我們就叫作數據框。在Python中可以通過pandas模塊的DataFrame函數構造數據框,而R語言則是data.frame創建數據框。接下來我們將對比Python和R語言如下幾個方面的應用:

                                                                              1、數據框的構造

                                                                              在Python中,可以借助于列表、元組、字典進行手工構建數據框,我們用例子說明:

                                                                              通過列表創建數據框

                                                                              微信圖片_20180209170844

                                                                               

                                                                              發現,這樣創建數據框的話,沒有變量名稱。該如何創建的時候加上列名稱呢?

                                                                              微信圖片_20180209171004

                                                                               

                                                                              是的,可以運用DataFrame函數中的columns參數給數據框的每列添加名稱,如果你需要給行加上索引名稱,你可以使用index參數。

                                                                              通過字典創建數據框

                                                                              微信圖片_20180209171046

                                                                               

                                                                              發現輸出結果中列名稱順序與構造時的數據不一致,這是因為字典并非是一種序列,而是一種特殊的鍵值對關系的對象。如果你需要按照指定的列順序排列,仍然可以通過columns參數實現。

                                                                              微信圖片_20180209171114

                                                                               

                                                                              在R語言中,構造數據框的方法就相對單一一些了,只需要往data.frame函數傳入向量對象即可。

                                                                              微信圖片_20180209171140

                                                                               

                                                                              2、數據的讀入

                                                                              在更多的場景下我們是讀取外部數據,然后基于外部數據進行數據分析、可視化、數據挖掘等研究。這里跟大家介紹一下文本文件、電子表格和MySQL數據庫的讀取。

                                                                              文本文件的讀取

                                                                              在pandas模塊中有read_table和read_csv兩個函數讀取常見的文本文件,這里就以txt和csv文件為例,對比Python和R語言的讀取。

                                                                              微信圖片_20180209171213

                                                                               

                                                                              read_table和read_csv兩個函數都可以讀文本文件數據,區別在于默認的sep參數不一致,read_table默認以制表符Tab鍵為字段間的間隔符,而read_csv默認以逗號為字段間的間隔符。

                                                                              由于原始數據文件books.txt沒有字段名稱,故設置header=None,并用names參數給表字段加上名稱,usecols則是設置讀取原始數據的哪些列。下面再來看看使用read_table函數讀取csv文件。

                                                                              微信圖片_20180209171242

                                                                               

                                                                              在R語言中,也有兩個常用的函數read.table和read.csv函數讀取txt和csv文件,不妨就用read.csv函數讀取上面的co2.csv數據集:

                                                                              微信圖片_20180209171306

                                                                               

                                                                              電子表格的讀取

                                                                              pandas模塊中read_excel函數可以非常方便的讀取外部的xls和xlsx電子表格:

                                                                              微信圖片_20180209171332

                                                                               

                                                                              在R語言中,基礎包就無法讀取電子表格數據了,這里強烈推薦R的用戶使用readxl包讀取Excel文件。但需要注意的一點是,數據的路徑一定不能包含中文,連文件名稱也不可以。

                                                                              微信圖片_20180209171358

                                                                               

                                                                              MySQL數據庫數據的讀取

                                                                              使用Python讀取MySQL數據庫,還需要結合pymysql模塊一起使用。這里我們就在本地的MySQL創建一個數據集,并用Python和R實現數據庫數據的讀取。

                                                                              在MySQL中創建數據

                                                                              微信圖片_20180209171454

                                                                               

                                                                              運用Python與MySQL創建連接,并讀取數據;

                                                                              微信圖片_20180209171520

                                                                               

                                                                              運用R與MySQL創建連接,并讀取數據(需要下載RMySQL包);

                                                                              微信圖片_20180209171545

                                                                               

                                                                              3、數據的概覽信息

                                                                              外部數據讀取到Python或R語言中,往往對數據需要做一些大概的了解,如最小值、最大值、平均值、各變量都是哪些數據類型、數據量如何等。我們來看看這些問題是如何解決的:

                                                                              微信圖片_20180209171619

                                                                               

                                                                              shape屬性和columns屬性返回數據集的行列數及變量名;

                                                                              微信圖片_20180209171650

                                                                              微信圖片_20180209171728

                                                                               

                                                                               

                                                                              describe屬性可以對數值型變量(include=['number'])和離散型變量(include=['object'])進行描述性統計;

                                                                              微信圖片_20180209171753

                                                                               

                                                                               

                                                                              info屬性則對數據集的變量類型進行簡單的描述。

                                                                              在R語言中,上面關于數據的概覽信息,可以對應到如下的代碼:

                                                                              微信圖片_20180209171834

                                                                               

                                                                              dim函數和names函數

                                                                              微信圖片_20180209172037

                                                                               

                                                                              summary函數進行統計描述;

                                                                              微信圖片_20180209172120

                                                                               

                                                                              str函數對數據集的變量類型進行描述。

                                                                              今天我們的內容就介紹到這邊,歡迎大家拍磚。下期我們來聊聊pandas模塊的數據框DataFrame第二部分。主要涉及變量、觀測的篩選;變量的重命名;數據類型的變換;排序和數據集的去重。

                                                                              ?

                                                                               

                                                                              作者:劉順祥

                                                                               


                                                                              上一篇 :
                                                                              下一篇 :

                                                                                      <thead id="xthz1"></thead>
                                                                                        <form id="xthz1"></form>

                                                                                            <sub id="xthz1"><meter id="xthz1"></meter></sub><thead id="xthz1"><meter id="xthz1"></meter></thead>

                                                                                            <thead id="xthz1"><meter id="xthz1"></meter></thead>

                                                                                            <th id="xthz1"></th>

                                                                                              <font id="xthz1"><meter id="xthz1"><i id="xthz1"></i></meter></font>

                                                                                                      <nobr id="xthz1"><meter id="xthz1"></meter></nobr>

                                                                                                      <th id="xthz1"><meter id="xthz1"></meter></th>

                                                                                                      <nobr id="xthz1"></nobr>

                                                                                                              <nobr id="xthz1"><meter id="xthz1"><var id="xthz1"></var></meter></nobr>

                                                                                                              <th id="xthz1"></th>
                                                                                                              <thead id="xthz1"><meter id="xthz1"><b id="xthz1"></b></meter></thead>
                                                                                                              
                                                                                                              

                                                                                                                  <pre id="xthz1"><noframes id="xthz1"><track id="xthz1"></track>

                                                                                                                      <nobr id="xthz1"><meter id="xthz1"><var id="xthz1"></var></meter></nobr>

                                                                                                                      <th id="xthz1"></th>

                                                                                                                        <address id="xthz1"></address>

                                                                                                                        <thead id="xthz1"><meter id="xthz1"></meter></thead>

                                                                                                                            <video id="xthz1"><span id="xthz1"><nobr id="xthz1"></nobr></span></video>

                                                                                                                              <th id="xthz1"><meter id="xthz1"></meter></th>

                                                                                                                              <th id="xthz1"></th>

                                                                                                                                <th id="xthz1"></th><track id="xthz1"><meter id="xthz1"></meter></track>

                                                                                                                                  <font id="xthz1"><meter id="xthz1"></meter></font><th id="xthz1"><meter id="xthz1"></meter></th>

                                                                                                                                      <sub id="xthz1"><progress id="xthz1"></progress></sub>

                                                                                                                                          <sub id="xthz1"></sub>

                                                                                                                                                      <track id="xthz1"><meter id="xthz1"></meter></track>
                                                                                                                                                          快3赚钱方法如下

                                                                                                                                                                  <thead id="xthz1"></thead>
                                                                                                                                                                    <form id="xthz1"></form>

                                                                                                                                                                        <sub id="xthz1"><meter id="xthz1"></meter></sub><thead id="xthz1"><meter id="xthz1"></meter></thead>

                                                                                                                                                                        <thead id="xthz1"><meter id="xthz1"></meter></thead>

                                                                                                                                                                        <th id="xthz1"></th>

                                                                                                                                                                          <font id="xthz1"><meter id="xthz1"><i id="xthz1"></i></meter></font>

                                                                                                                                                                                  <nobr id="xthz1"><meter id="xthz1"></meter></nobr>

                                                                                                                                                                                  <th id="xthz1"><meter id="xthz1"></meter></th>

                                                                                                                                                                                  <nobr id="xthz1"></nobr>

                                                                                                                                                                                          <nobr id="xthz1"><meter id="xthz1"><var id="xthz1"></var></meter></nobr>

                                                                                                                                                                                          <th id="xthz1"></th>
                                                                                                                                                                                          <thead id="xthz1"><meter id="xthz1"><b id="xthz1"></b></meter></thead>
                                                                                                                                                                                          
                                                                                                                                                                                          

                                                                                                                                                                                              <pre id="xthz1"><noframes id="xthz1"><track id="xthz1"></track>

                                                                                                                                                                                                  <nobr id="xthz1"><meter id="xthz1"><var id="xthz1"></var></meter></nobr>

                                                                                                                                                                                                  <th id="xthz1"></th>

                                                                                                                                                                                                    <address id="xthz1"></address>

                                                                                                                                                                                                    <thead id="xthz1"><meter id="xthz1"></meter></thead>

                                                                                                                                                                                                        <video id="xthz1"><span id="xthz1"><nobr id="xthz1"></nobr></span></video>

                                                                                                                                                                                                          <th id="xthz1"><meter id="xthz1"></meter></th>

                                                                                                                                                                                                          <th id="xthz1"></th>

                                                                                                                                                                                                            <th id="xthz1"></th><track id="xthz1"><meter id="xthz1"></meter></track>

                                                                                                                                                                                                              <font id="xthz1"><meter id="xthz1"></meter></font><th id="xthz1"><meter id="xthz1"></meter></th>

                                                                                                                                                                                                                  <sub id="xthz1"><progress id="xthz1"></progress></sub>

                                                                                                                                                                                                                      <sub id="xthz1"></sub>

                                                                                                                                                                                                                                  <track id="xthz1"><meter id="xthz1"></meter></track>

                                                                                                                                                                                                                                              <thead id="xthz1"></thead>
                                                                                                                                                                                                                                                <form id="xthz1"></form>

                                                                                                                                                                                                                                                    <sub id="xthz1"><meter id="xthz1"></meter></sub><thead id="xthz1"><meter id="xthz1"></meter></thead>

                                                                                                                                                                                                                                                    <thead id="xthz1"><meter id="xthz1"></meter></thead>

                                                                                                                                                                                                                                                    <th id="xthz1"></th>

                                                                                                                                                                                                                                                      <font id="xthz1"><meter id="xthz1"><i id="xthz1"></i></meter></font>

                                                                                                                                                                                                                                                              <nobr id="xthz1"><meter id="xthz1"></meter></nobr>

                                                                                                                                                                                                                                                              <th id="xthz1"><meter id="xthz1"></meter></th>

                                                                                                                                                                                                                                                              <nobr id="xthz1"></nobr>

                                                                                                                                                                                                                                                                      <nobr id="xthz1"><meter id="xthz1"><var id="xthz1"></var></meter></nobr>

                                                                                                                                                                                                                                                                      <th id="xthz1"></th>
                                                                                                                                                                                                                                                                      <thead id="xthz1"><meter id="xthz1"><b id="xthz1"></b></meter></thead>
                                                                                                                                                                                                                                                                      
                                                                                                                                                                                                                                                                      

                                                                                                                                                                                                                                                                          <pre id="xthz1"><noframes id="xthz1"><track id="xthz1"></track>

                                                                                                                                                                                                                                                                              <nobr id="xthz1"><meter id="xthz1"><var id="xthz1"></var></meter></nobr>

                                                                                                                                                                                                                                                                              <th id="xthz1"></th>

                                                                                                                                                                                                                                                                                <address id="xthz1"></address>

                                                                                                                                                                                                                                                                                <thead id="xthz1"><meter id="xthz1"></meter></thead>

                                                                                                                                                                                                                                                                                    <video id="xthz1"><span id="xthz1"><nobr id="xthz1"></nobr></span></video>

                                                                                                                                                                                                                                                                                      <th id="xthz1"><meter id="xthz1"></meter></th>

                                                                                                                                                                                                                                                                                      <th id="xthz1"></th>

                                                                                                                                                                                                                                                                                        <th id="xthz1"></th><track id="xthz1"><meter id="xthz1"></meter></track>

                                                                                                                                                                                                                                                                                          <font id="xthz1"><meter id="xthz1"></meter></font><th id="xthz1"><meter id="xthz1"></meter></th>

                                                                                                                                                                                                                                                                                              <sub id="xthz1"><progress id="xthz1"></progress></sub>

                                                                                                                                                                                                                                                                                                  <sub id="xthz1"></sub>

                                                                                                                                                                                                                                                                                                              <track id="xthz1"><meter id="xthz1"></meter></track>