公司IT不给力,是不是就不要搞cluster了

n
nowhere7
楼主 (未名空间)

传统大型公司分部,新点刚组建几年
IT感觉很不给力,熟悉linux都不多

最近要搞几套机器,近期都是我用
想cluster好处是水平scalability,未来扩展容易
另外我觉得每个core的cost低一些,同样预算可以有更多核心
但是这系统设置维护感觉都麻烦啊,本地的IT估计搞不定
总公司的就算能搞定,一个ticket搞你几周也要死人的
我自己搞估计还靠谱点,但是不可能给我碰

另外cluster如果起始node太少,比如4个,感觉优势不大?
感觉有限的预算,比如30-40K,只有用PC级别的硬件才能显示出cluster的优势

如果走单机路线,从大的厂商dell/hp之类搞套如下类似的系统大概要多少钱?
硬盘我搞个32TB raid 6就好了
我们有个大的硬盘系统

-----------
发信人: yanb (呀), 信区: Hardware
标 题: Re: 一直想给大家推荐一台好pc
发信站: BBS 未名空间站 (Sat Aug 15 01:19:49 2020, 美东)

最近配了一台23k的工作站,还没拿到手,64核,1tb内存,128TB硬盘,
2TB OS SSD,Quadro RTX 8000(可能还要升级成双显卡)。

Socket: Dual AM4 7002 EPYC Series Processor Support
CPU: Dual EPYC 7452 2.35 GHz Thirty-Two (32) Core 155W
DIMM Slots: Sixteen (16), Up to 2TB Registered ECC DDR4
Memory: 1024GB (16x64GB) 3200 DDR4 RDIMM
OS Drives: Dual 1TB M.2 NVMe SSD (HW RAID1)
OS Installed: RHEL Workstation Standard One Year License
PCIe Slots: Two (2) 3.0 x16, Three (3) 3.0 x8, Two (2) 3.0 x4 M.2
GPU: NVIDIA Quadro RTX 8000 PCIe 3.0 x16 48GB GDDR6
GPU Promotion: Instant NVIDIA EDU Rebate of $800 Per RTX 8000
Drive Bays: Eight (8) 3.5" Hot-Swap
Storage Controller: LSI MegaRAID 9460-16i PCIe 3.1
Storage: 128TB (8x16TB) SAS HDD (96TB HW RAID6)
Network: Dual 10GbE LAN Ports
Remote Management: IPMI 2.0, KVM + Media over Dedicated LAN
Power Supply: Platinum Level 1620W Redundant
kz80

Cloud?

【 在 nowhere7 (折腾) 的大作中提到: 】
: 传统大型公司分部,新点刚组建几年
: IT感觉很不给力,熟悉linux都不多
: 最近要搞几套机器,近期都是我用
: 想cluster好处是水平scalability,未来扩展容易
: 另外我觉得每个core的cost低一些,同样预算可以有更多核心
: 但是这系统设置维护感觉都麻烦啊,本地的IT估计搞不定
: 总公司的就算能搞定,一个ticket搞你几周也要死人的
: 我自己搞估计还靠谱点,但是不可能给我碰
: 另外cluster如果起始node太少,比如4个,感觉优势不大?
: 感觉有限的预算,比如30-40K,只有用PC级别的硬件才能显示出cluster的优势
: ...................

n
nowhere7

不太现实,我部门对data flow有严格监控
【 在 kz80 (慢枪手) 的大作中提到: 】
: Cloud?

chunjuan

vSphere + terraform ?
这玩意真只能用民用pc硬件
我们最近上了个新的dell 服务器 配置比下面那个差多了 价格还差不多
【 在 nowhere7 (折腾) 的大作中提到: 】
: 传统大型公司分部,新点刚组建几年
: IT感觉很不给力,熟悉linux都不多
: 最近要搞几套机器,近期都是我用
: 想cluster好处是水平scalability,未来扩展容易
: 另外我觉得每个core的cost低一些,同样预算可以有更多核心
: 但是这系统设置维护感觉都麻烦啊,本地的IT估计搞不定
: 总公司的就算能搞定,一个ticket搞你几周也要死人的
: 我自己搞估计还靠谱点,但是不可能给我碰
: 另外cluster如果起始node太少,比如4个,感觉优势不大?
: 感觉有限的预算,比如30-40K,只有用PC级别的硬件才能显示出cluster的优势
: ...................

Notalandlord

不矛盾,cloud只会更安全可控

[在 nowhere7 (折腾) 的大作中提到:]
:不太现实,我部门对data flow有严格监控
J
JustSac

自己搞cluster那是大工程,分布存储、计算、追踪、日志、消息队列、安全等任何一
项都是大事,程序可能还得用gRPC重写,还是整多点core的计算机升级简单些。
n
nowhere7

老板让我看看HPC的方案
我就给列了一下,牛x单机什么都好,就是没有scalability
所以老板就倾向cluster了

其实我预期我们近期搞一两台牛x机器就好,但是谁敢拍胸脯呢

【 在 JustSac (置鼎) 的大作中提到: 】
: 自己搞cluster那是大工程,分布存储、计算、追踪、日志、消息队列、安全等任何一
: 项都是大事,程序可能还得用gRPC重写,还是整多点core的计算机升级简单些。

n
nowhere7

这个必须IT和OT认证才行
集团的一个子公司在考虑退休掉自己的cluster转向cloud
可能一考虑半年以年就过去了
【 在 Notalandlord (少量土地出租) 的大作中提到: 】
: 不矛盾,cloud只会更安全可控
: [在 nowhere7 (折腾) 的大作中提到:]
: :不太现实,我部门对data flow有严格监控

p
pptwo

这还只是技术人员能自己慢慢摸索的,机器一多还有走线供电散热这些机房建设的事情。

【 在 JustSac (置鼎) 的大作中提到: 】
: 自己搞cluster那是大工程,分布存储、计算、追踪、日志、消息队列、安全等任何一
: 项都是大事,程序可能还得用gRPC重写,还是整多点core的计算机升级简单些。

z
zhegufei2015

15年前装过Rocks 的cluster。16台双路AMD双核服务器,所以一共64个核心。外加一个前端机器和一个文件服务器。大概用了10年退役了。感觉挺容易的,照着Rocks的
tutorial 安装就好了。另外,设备的钱和人工比就是小意思,所有什么配件都买高级
货。就是不知道你们要不要买磁带机备份。

现在一个AMD 芯片就有64核心。内存多搞点.一台工作站就抵得上我以前搞得Cluster。直接装个Linux就完事了。

你要的Cluster啥规模?自己学戏自己维护好了。如果Linux熟,没啥难的。

d
dragon71

以我的经验cluster纯粹是向不懂的企业用户骗钱的。在应用层下点功夫,做好分布计
算比cluster安全多了
s
skybluewei

问题是干嘛用?自己算算还是要对外的?安全性有什么要求?为啥不用现成的比如AWS
?Google cloud,Azure一类的?

★ 发自iPhone App: ChinaWeb 1.1.5