Pandas 04 : Pandas columns

Data SciencePandas 04 : Pandas columns

สวัสดีครับ วันนี้ก็เป็นตอนที่ 4 แล้ว เราจะเมาเรียนเรื่อง Panda กันเพิ่มเติม คือ การดูข้อมูลสถิติเบื้องต้น การจัดการ Column กันครับ

เริ่มต้นจากการ import library แล้วก็อ่านข้อมูลจาก csv ก่อนครับ
import pandas as pd
df = pd.read_csv("http://bit.ly/SampleSalesData")

Describe

คำสั่งแรก describe() จะเป็น function เพื่อใช้บอกข้อมูลสถิติเบื้องต้นครับ ได้แก่

  • count คือจำนวนข้อมูล
  • mean ค่าเฉลี่ยของข้อมูล
  • std ค่าเบี่ยงเบนมาตรฐาน คือข้อมูลมีการกระจายจากค่าเฉลี่ยมากน้อยเพียงใด ถ้า std มาก ก้อมีการกระจายมาก
  • min ค่าต่ำสุด
  • 25% Percentile ที่ 25 ของข้อมูล ซึ่ง percentile เป็นการแบ่งข้อมูลที่เรียงจากน้อยไปมากออกเป็น 100 ส่วนเท่า ๆ ครับ
  • 50% Percentile ที่ 50 ซึ่งก็คือค่า Medial หรือ มัธยฐาน คือ ค่าที่มีตำแหน่งอยู่กึ่งกลางของข้อมูลทั้งหมด
  • 75% Percentile ที่ 75
  • max ค่าสูงสุดของข้อมูล

สังเกตได้ว่าจาก Output จะมีเฉพาะข้อมูลที่เป็น numeric เท่านั้น ถ้าเราอยากดูข้อมูลประเภทอื่นด้วยเราก็สามารถใส่ parameter list ของ data types ใน property inlcude เข้าไปได้เลยครับ หรือถ้าอยากดูทั้งหมดก็ include=’all’ ได้เลย สิ่งที่เราเห็นเพิ่มขึ้นมาเมื่อเรา include object เข้าไป

  • unique คือ จำนวนข้อมูลที่ตัดส่วนที่ซ้ากัน ออกไป
  • top คือข้อมูลที่มีจำนวนซ้ำกันมากที่สุด
  • freq ค่าความถี่ที่ข้อมูลซ้ำกันมากสุด

 

การจัดการ pandas column

เริ่มต้นด้วยการดูรายชื่อ column ทั้งหมด ใน dataframe ของเราได้โดยคำสั่ง columns ครับ

df.columns

เปลี่ยนชื่อ Column (1)

การเปลี่ยนชื่อ column สามารถทำได้โดยคำสั่ง rename ครับ โดยเราสามารถระบุชื่อ column ที่ต้องการเปลี่ยนชื่อ และชื่อใหม่ได้เลย โดยถ้าหากว่าเราต้องการให้มีการเปลี่ยนแปลงใน dataframe ทันที เราต้องใส่ inplace=True เข้าไปด้วยครับ ไม่งั้นจะเป็นการแสดงผลให้ดูเฉยๆ

#Rename country
#On the fly so we need to add inplace=True to make change imediately.
df.rename(columns= {'Retailer country' : 'Country'}, inplace=True)

เปลี่ยนชื่อ Column (2)

อีกวิธีนึงคือเราสามารถใช้ list ในการเปลี่ยนชื่อ column ได้ทั้งหมดในทีเดียวได้เลยครับ

ขั้นแรกก็สร้าง list ของชื่อ column ใหม่ที่เราต้องการก่อน แล้วเอาไปแทนที่ได้เลย

# multiple change column name
col_name = ['Country', 'OrderMethod', 'RetailerType', 'ProductLine', 'ProductType', 'ProductName', 'Year','Quarter','Revenue','Quantity','GrossMargin']
df.columns = col_name

สำหรับวันนี้ก็คงเท่านี้ก่อนครับ อย่าลืมหมั่นฝึกฝนบ่อยๆ นะครับ

ชอบกด Like ใช่กด Share แย่ช่วยแนะนำ ด้วยนะครับ

สวัสดีครับ

 

Related articles

การใช้ Claude Desktop MCP เชื่อมต่อกับ Notion ผ่าน smithery.ai – คู่มือฉบับสมบูรณ์

เรียนรู้วิธีตั้งค่าและใช้งาน Claude Desktop MCP เพื่อเชื่อมต่อกับ Notion ผ่าน smithery.ai ทีละขั้นตอน เหมาะสำหรับผู้เริ่มต้นที่ต้องการสร้าง AI workflow automation เพื่อจัดการงานและข้อมูลอย่างมีประสิทธิภาพ

อาชีพใหม่สำหรับยุค AI: เตรียมพร้อมคว้าโอกาสในโลกการทำงานที่ขับเคลื่อนด้วยปัญญาประดิษฐ์

ค้นพบอาชีพใหม่มาแรงในยุค AI พร้อมทักษะที่จำเป็น และแนวทางเตรียมตัวสำหรับเจ้าของธุรกิจ SME และคนทำงาน เพื่อเติบโตในโลกที่ขับเคลื่อนด้วย AI ไปกับ Data-Espresso

Vibe Coding: เทรนด์ใหม่ในการพัฒนาซอฟต์แวร์ด้วย AI

ทำความรู้จักกับ Vibe Coding เทรนด์ใหม่ที่ใช้ AI ในการพัฒนาซอฟต์แวร์ ช่วยให้โค้ดดิ้งง่ายขึ้นและมีประสิทธิภาพมากขึ้น

DeepSeek R1: ผู้ท้าชิงใหม่ด้านการใช้เหตุผลของ AI ที่น่าจับตา

DeepSeek R1 โมเดล AI ใหม่ ที่มีความสามารถด้านการใช้เหตุผลใกล้เคียง OpenAI o1 แต่ต้นทุนถูกกว่าถึง 27 เท่า จะเปลี่ยนวงการ AI หรือไม่?

AI หนุนอนาคตสดใส Product Manager แต่ยังขาดแคลนทักษะ AI

AI ทำให้การพัฒนาซอฟต์แวร์เร็วขึ้น ส่งผลให้ความต้องการ Product Manager เพิ่มสูง แต่ยังขาดแคลนผู้มีทักษะด้าน AI
บทความก่อนหน้านี้
บทความถัดไป

Related Article

Presentation Preparation Prompt

#ROLE คุณเป็นนักวิเคราะห์การตลาดระดับอาวุโส มีประสบการณ์ 15+ ปี ในการวิจัยและวิเคราะห์ตลาดสากล #INSTRUCTION จัดทำรายงานการวิเคราะห์ตลาดที่ครอบคลุมและเป็นกลาง สำหรับการตัดสินใจเข้าสู่ตลาดใหม่ #STEPS 1. รวบรวมและวิเคราะห์ข้อมูลตลาดปัจจุบัน 2. ศึกษาพฤติกรรมและความต้องการของกลุ่มเป้าหมาย 3. วิเคราะห์คู่แข่งและโครงสร้างตลาด 4. ประเมินปัจจัยความสำเร็จและอุปสรรค 5. จัดอันดับความน่าสนใจของตลาดตามเกณฑ์วัดผล 6. เสนอแนะแนวทางและทางเลือกในการเข้าสู่ตลาด #EXPECTATION รายงานการวิเคราะห์ตลาดที่: - นำเสนอข้อมูลเป็นกลาง ไม่มีอคติ - อ้างอิงแหล่งข้อมูลที่เชื่อถือได้ - ให้ภาพรวมที่ครบถ้วนและสมดุล - มีคำแนะนำที่ปฏิบัติได้จริง #EXAMPLE <MARKET_REPORT> 1. บทสรุปผู้บริหาร (≤ 200 คำ) 2. ภาพรวมตลาด (ตาราง) 3. การวิเคราะห์เชิงลึกแต่ละตลาด 4....
person holding marker

Mega Prompt – Marketing Strategy

ในบทนี้เรามาเจาะลึกกันถึงเรื่องที่กำลังฮอตฮิตติดเทรนด์สุดๆ ในวงการการตลาดกันเลยนะครับ นั่นก็คือการใช้ AI อย่าง ChatGPT มาช่วยในการวิจัยตลาดและวิเคราะห์คู่แข่งเพื่อพัฒนากลยุทธ์ทางการตลาด ก่อนอื่น ผมขอเกริ่นนำสักนิดนะครับว่า... ในยุคที่ข้อมูลท่วมท้นแบบนี้ การจะเข้าถึงและวิเคราะห์ข้อมูลให้ทันกับความเปลี่ยนแปลงของตลาดนั้น ไม่ใช่เรื่องง่ายเลย แต่ด้วยพลังของ AI อย่าง ChatGPT ที่สามารถประมวลผลข้อมูลมหาศาลได้ในเวลาอันรวดเร็ว ทำให้งานวิจัยตลาดของเราง่ายขึ้นเยอะเลยล่ะครับ! #funfacts รู้หรือไม่? ChatGPT สามารถประมวลผลข้อมูลได้มากกว่า 100 ล้านพารามิเตอร์ ซึ่งมากกว่าสมองมนุษย์ถึง 1,000...

Prompt วิเคราะห์งบการเงิน

ตัวอย่างการนำ AI มาใช้ในการวิเคราะห์งบการเงิน Prompt นี้เหมาะกับการใช้งาน Claude, Gemini Prompt #ROLE: คุณเป็นนักวิเคราะห์การเงินผู้เชี่ยวชาญที่มีความเชี่ยวชาญในการประเมินผลการดำเนินงานและความสามารถในการทำกำไรของธุรกิจ #INSTRUCTIONS: สร้างรายงานวิเคราะห์การเงินแบบครอบคลุมเพื่อประเมินผลการดำเนินงานทางธุรกิจของบริษัท โดยใช้ข้อมูลการเงินจากไฟล์ Excel ที่มีหลาย sheet และนำเสนอในรูปแบบรายงาน HTML พร้อมกราฟสำหรับนักลงทุน #STEPS: 1. อ่านและตรวจสอบไฟล์ Excel - ดูรายชื่อ sheet ทั้งหมดและระบุประเภทของแต่ละ sheet...
สอบถามข้อมูล