影视:朋友换5,讲述了 "
第一个项目是分析那些交通摄像录像,看看是否可以确定导致行人意外的模式。这是大量的完全非结构化的数据,视频数据可能超过100万小时。
克里斯:现在亟须解决的问题是,这些数据对于寻找解决方案都是必须的吗?对于那些没有发生交通事故的十字路口的监控录像,我们可以筛掉它,以减少数据集。我们也可以用其他标准来筛掉更多的数据。
艾美:显然,数据不需要保存很久。交通摄像头的视频将使用AI技术来判定,然后他们就不再需要这些数据了。
克里斯:访问数据可能只是视频收集并将它存储在容量超大的磁盘或上传至云端过程中的一个问题。这可能会面临一些法律问题,如隐私问题。如果这些视频属于多方,如市政府、警察局,或许还有私人公司,那么就需要与每一方联系并做出安排。
不同部门、公司或政府机构的数据会被存储在孤岛中——不同的组织中的数据库是独立的,每一个数据库以不同的格式存储,甚至使用的是不同的数据库应用程序。例如,一家公司可能使用Oracle,另一家可能使用Microsoft SQL,第三家可能使用专有数据库。
.