每日最新頭條.有趣資訊

增強Jupyter Notebook的功能,這裡有四個妙招

選自toward data science

作者:George Seif

機器之心編譯

參與:魔王

你對 Jupyter Notebook 了解多少?本文介紹了一些自定義功能,幫助你使用 Jupyter notebook 更高效地寫代碼。

Jupyter Notebook 是所有開發者共享工作的神器,它為共享 Notebooks 提供了一種便捷方式:結合文本、代碼和圖更快捷地將信息傳達給閱聽人。目前,Jupyter Notebook 已經應用於數據分析和數據科學等領域。

然而,大部分開發者僅僅了解其皮毛。開發者使用 Jupyter Notebook 的基本功能來寫 Python 代碼、展示圖。但是你們知道 Jupyter 中還有大量自定義功能嗎?這些很酷的選項可以幫助你使用 Jupyter notebook 更高效地寫代碼、展示圖。

本文將介紹強化 Jupyter Notebook 功能的 4 種方法。

1. 執行 Shell 命令

在技術或編程文本中,shell 表示使用文本與計算機進行互動的方式。最流行的 Unix shell 是 Bash(Bourne Again SHell),Bash 是 Linux 機器上終端默認的 shell。

在使用 Python 工作時,你會經常在寫 Python 代碼和使用 shell 命令之間來回切換。例如,你想使用 Python 讀取磁盤中的某份文件,而這需要你確認文件名。通常情況下,你需要在終端輸入 ls,獲得當前目錄的所有文件和文件夾列表。但這樣來回切換非常繁瑣低效。

很炫酷的是,Jupyter 能夠執行 Shell 命令,你甚至無需離開瀏覽器。只需要在 shell 命令前加一個感歎號!,Jupyter 會將其轉換為 Bash。在任一命令前加感歎號!,它們就可以在 Python Jupyter Notebook 中運行。

我們還可以將 shell 命令的輸出分配給 Python 變量,如下所示:

2. 更換主題

很多文本編輯器和編程 IDE 都有自定義主題。開發者最喜歡的主題之一是暗黑主題(如 monaki),因為對於整天盯著螢幕的開發者而言,暗黑主題看起來比較舒適。幸運的是,Jupyter 有一個插件,允許用戶自行選擇主題。

要想安裝該插件,你只需在終端中運行以下 pip 命令:

運行以下命令,可得到可用的主題列表:

截至本文寫作時,可選擇的主題包括:

查看這些主題,如下圖所示,我們擁有大量不同的顏色選擇。

solarizedd(左),gruvboxl(中),grade3(右)。

3. Notebook 擴展插件

Jupyter Notebook 擴展插件(nbextensions)是一些 JavaScript 模塊,你可以使用它們強化 Notebook 的功能以及使用。擴展插件本質上修改了 Jupyter UI,以實現更穩健的功能。

我們首先通過 pip 安裝 nbextensions:

安裝完成後,啟動 Jupyter。你將看到一個新選項——NBextensions。選擇它之後,你會看到大量 Jupyter Notebook 擴展插件選項。

通過快速搜索,你可以查看這些擴展插件的功能。下面我將介紹幾個最重要的插件。

Table of Contents

正如其名稱所描述的那樣,Table of Contents 基於 notebook 中 # 創建的標題自動生成目錄。例如,我在 notebook 中創建了以下標題:

則左側會生成目錄。雙擊標題,可鏈接至對應章節內容。當 notebook 規模很大,選項很多時,這個功能非常方便!

Hinterland

代碼補全是大部分 IDE 都具備的常見功能,比如 PyCharm。開發者喜歡這個功能,因為這使得他們的工作更加簡單,開發者無需記住每一個命令,IDE 會準備好一切。

Hinterland 可在 Jupyter Notebook 內完成代碼補全。在鍵入過程中,你會看到一些代碼補全建議。尤其是當你搜索外部庫的命令時(示例如下所示)。這簡直太方便了!

拆分單元格(Split Cells)

拆分單元格允許開發者並排查看 2 個單元格。當你有兩個相關單元格時(比如描述及其對應的圖示),這個功能非常方便。

4. 使用 Qgrid 探索 Dataframes

最後一站是 Qgrid,該工具允許開發者在不使用複雜 Pandas 代碼的情況下,探索和編輯數據幀。Qgrid 可在 Jupyter notebook 中以互動的方式渲染 pandas 數據幀,這樣你就可以執行一些直觀的控制,如滾動、排序和篩選,以及雙擊單元格編輯數據幀。

我們首先安裝 Qgrid:

要想使用 Qgrid 渲染數據幀,開發者只需導入 Qgrid,然後將數據幀輸入到 show_grid 函數:

這樣,你可以對數據幀執行大量互動式操作:

添加和刪除行;

篩選行;

編輯單元格。

將更多參數輸入 show_grid 函數可以執行其他互動式操作。關於 Qgrid 的全部功能,參見:https://github.com/quantopian/qgrid。

以上就是強化 Jupyter Notebook 功能的 4 種方法。

本文為機器之心編譯,轉載請聯繫本公眾號獲得授權。

------------------------------------------------

獲得更多的PTT最新消息
按讚加入粉絲團