Pandas 04 : Pandas columns

Data SciencePandas 04 : Pandas columns

สวัสดีครับ วันนี้ก็เป็นตอนที่ 4 แล้ว เราจะเมาเรียนเรื่อง Panda กันเพิ่มเติม คือ การดูข้อมูลสถิติเบื้องต้น การจัดการ Column กันครับ

เริ่มต้นจากการ import library แล้วก็อ่านข้อมูลจาก csv ก่อนครับ
import pandas as pd
df = pd.read_csv("http://bit.ly/SampleSalesData")

Describe

คำสั่งแรก describe() จะเป็น function เพื่อใช้บอกข้อมูลสถิติเบื้องต้นครับ ได้แก่

  • count คือจำนวนข้อมูล
  • mean ค่าเฉลี่ยของข้อมูล
  • std ค่าเบี่ยงเบนมาตรฐาน คือข้อมูลมีการกระจายจากค่าเฉลี่ยมากน้อยเพียงใด ถ้า std มาก ก้อมีการกระจายมาก
  • min ค่าต่ำสุด
  • 25% Percentile ที่ 25 ของข้อมูล ซึ่ง percentile เป็นการแบ่งข้อมูลที่เรียงจากน้อยไปมากออกเป็น 100 ส่วนเท่า ๆ ครับ
  • 50% Percentile ที่ 50 ซึ่งก็คือค่า Medial หรือ มัธยฐาน คือ ค่าที่มีตำแหน่งอยู่กึ่งกลางของข้อมูลทั้งหมด
  • 75% Percentile ที่ 75
  • max ค่าสูงสุดของข้อมูล

สังเกตได้ว่าจาก Output จะมีเฉพาะข้อมูลที่เป็น numeric เท่านั้น ถ้าเราอยากดูข้อมูลประเภทอื่นด้วยเราก็สามารถใส่ parameter list ของ data types ใน property inlcude เข้าไปได้เลยครับ หรือถ้าอยากดูทั้งหมดก็ include=’all’ ได้เลย สิ่งที่เราเห็นเพิ่มขึ้นมาเมื่อเรา include object เข้าไป

  • unique คือ จำนวนข้อมูลที่ตัดส่วนที่ซ้ากัน ออกไป
  • top คือข้อมูลที่มีจำนวนซ้ำกันมากที่สุด
  • freq ค่าความถี่ที่ข้อมูลซ้ำกันมากสุด

 

การจัดการ pandas column

เริ่มต้นด้วยการดูรายชื่อ column ทั้งหมด ใน dataframe ของเราได้โดยคำสั่ง columns ครับ

df.columns

เปลี่ยนชื่อ Column (1)

การเปลี่ยนชื่อ column สามารถทำได้โดยคำสั่ง rename ครับ โดยเราสามารถระบุชื่อ column ที่ต้องการเปลี่ยนชื่อ และชื่อใหม่ได้เลย โดยถ้าหากว่าเราต้องการให้มีการเปลี่ยนแปลงใน dataframe ทันที เราต้องใส่ inplace=True เข้าไปด้วยครับ ไม่งั้นจะเป็นการแสดงผลให้ดูเฉยๆ

#Rename country
#On the fly so we need to add inplace=True to make change imediately.
df.rename(columns= {'Retailer country' : 'Country'}, inplace=True)

เปลี่ยนชื่อ Column (2)

อีกวิธีนึงคือเราสามารถใช้ list ในการเปลี่ยนชื่อ column ได้ทั้งหมดในทีเดียวได้เลยครับ

ขั้นแรกก็สร้าง list ของชื่อ column ใหม่ที่เราต้องการก่อน แล้วเอาไปแทนที่ได้เลย

# multiple change column name
col_name = ['Country', 'OrderMethod', 'RetailerType', 'ProductLine', 'ProductType', 'ProductName', 'Year','Quarter','Revenue','Quantity','GrossMargin']
df.columns = col_name

สำหรับวันนี้ก็คงเท่านี้ก่อนครับ อย่าลืมหมั่นฝึกฝนบ่อยๆ นะครับ

ชอบกด Like ใช่กด Share แย่ช่วยแนะนำ ด้วยนะครับ

สวัสดีครับ

 

Related articles

DeepSeek R1: ผู้ท้าชิงใหม่ด้านการใช้เหตุผลของ AI ที่น่าจับตา

DeepSeek R1 โมเดล AI ใหม่ ที่มีความสามารถด้านการใช้เหตุผลใกล้เคียง OpenAI o1 แต่ต้นทุนถูกกว่าถึง 27 เท่า จะเปลี่ยนวงการ AI หรือไม่?

AI หนุนอนาคตสดใส Product Manager แต่ยังขาดแคลนทักษะ AI

AI ทำให้การพัฒนาซอฟต์แวร์เร็วขึ้น ส่งผลให้ความต้องการ Product Manager เพิ่มสูง แต่ยังขาดแคลนผู้มีทักษะด้าน AI

Common Sense Recommendation Engine

ปฏิวัติระบบแนะนำสินค้าด้วย Common Sense Recommendation Engine และพลังของ AI 🤖

Ollama: แพลตฟอร์มจัดการ LLM แบบออฟไลน์ที่น่าจับตามอง

Ollama คือเครื่องมือที่ช่วยให้นักพัฒนาสามารถใช้งาน LLM บนเครื่องตัวเองได้ โดยไม่ต้องพึ่งพาคลาวด์ เน้นความปลอดภัยและความเป็นส่วนตัวสูง

เจาะลึกโลกของ Machine Learning: ประเภท การประยุกต์ใช้ และตัวอย่างในชีวิตจริง

เรียนรู้เกี่ยวกับ Machine Learning ประเภทต่างๆ การนำไปใช้งาน และตัวอย่างในชีวิตจริง เข้าใจง่ายแม้ไม่มีพื้นฐาน พร้อมข้อมูลล่าสุดและแนวโน้มในอนาคต
บทความก่อนหน้านี้
บทความถัดไป

Related Article

Google Gemini 2.5 Pro: AI ที่คิดเองได้ เปิดให้ใช้ฟรีแล้ววันนี้!

Google ปล่อย Gemini 2.5 Pro ที่มีความสามารถในการคิดวิเคราะห์แบบธรรมชาติ แซงหน้า OpenAI และ Claude ใช้ฟรีผ่าน Google AI Studio

Dify.AI: เครื่องมือ Open Source สร้าง AI Agent แบบ No-Code ติดตั้งเองได้ในไม่กี่นาที!

ในคลิปนี้เราจะพาทุกคนมารู้จักกับ Dify.AI เครื่องมือ Open Source สำหรับสร้าง AI Agent แบบ No-Code และเปรียบเทียบกับ n8n ที่มีความสามารถโดดเด่นในด้าน AI Workflow Automation https://youtu.be/lHcJ0XH3ZGE?si=FyoDJCWkH4YH73mQ ⏱️ Timestamps:00:00 - แนะนำ Dify.AI สำหรับการสร้าง AI Agent01:09...

Telegram bot: ทางเลือกทดแทน LINE Notify 🚀

เตรียมพร้อมรับมือการปิดตัวของ LINE Notify ด้วย Telegram Bot บน Make.com ทางเลือกที่ดีกว่า ฟรี 100% มีความสามารถมากกว่า และใช้งานง่ายกว่า พร้อมวิธีการเชื่อมต่อแบบละเอียดและตัวอย่างการนำไปใช้งานจริง
สอบถามข้อมูล