DataFrame ์ ํ๊ณผ ์ด์ด ์๋ ๋ฐ์ดํฐ ํ
์ด๋ธ์ ๋ํ๋ด๋ฉฐ, DataFrame ๊ฐ๋
์ ์ด๋ค ํ๋ก๊ทธ๋๋ฐ ์ธ์ด์์๋ ๋ณํ์ง ์์ง๋ง Spark ์ Pandas ์ DataFrame ์ ์๋นํ ๋ค๋ฅด๋ค. ์ด ๊ธ์์๋ Spark DataFrame๊ณผ Pandas DataFra,e์ ์ฐจ์ด์ ์ ์์๋ณด๋ ค๊ณ ํฉ๋๋ค.
Pandas DataFrame
Panda๋ NumPy ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ๋ ์คํ ์์ค Python ๋ผ์ด๋ธ๋ฌ๋ฆฌ์
๋๋ค. ๋ค์ํ ๋ฐ์ดํฐ ๊ตฌ์กฐ์ ์ฐ์ฐ์ ์ฌ์ฉํ์ฌ ์์น ๋ฐ์ดํฐ์ ์๊ณ์ด์ ์กฐ์ํ ์ ์๋ Python ํจํค์ง์
๋๋ค. ์ฃผ๋ก ๋ฐ์ดํฐ ๊ฐ์ ธ์ค๊ธฐ ๋ฐ ๋ถ์์ ์๋นํ ์ฝ๊ฒ ํ๊ธฐ ์ํด ์ฌ์ฉ๋ฉ๋๋ค. Panda DataFrame์ ๋ ์ด
2023-03-16 11:13:02 |
OkOJJ