Created March 20, 2022 © MIT

Porch Pirate Theft Detection

This application detect and deters porch pirates from stealing packages.

IntermediateShowcase (no instructions)5 hours57

Things used in this project

Hardware components

AMD Kria KV260 Vision AI Starter Kit

Camera (generic)

Software apps and online services

AMD PYNQ Framework

Story

Problem

In the USA, the Covid-19 pandemic coupled with government lockdown response spurred the rise of the work at home environment. Massive inflation from the FED to bail out the citizens plus the USA decision to sanction Russia for invading Ukraine drove up the price of oil further encouraged work at home life style as traveling by car became more expensive. More people ordered packages to be delivered at their front doorstep and the number of porch package thefts increased.

Solution

To solve this porch package theft problem, existing solutions such as Amazon's Ring door bell are capable of sending a notification to the home owner when motion is detected outside of the front door. However sometimes notifications have delay or the owner has put his/her phone on Do Not Disturb. I wanted a solution that could respond to package theft in real time.

Detection

Package theft can be detected in a number of ways. The easiest way is to detect theft is to check if the package moved upwards. The only time a package moves upwards is if the owner picks it up, or a thief picks it up. The system should allow the owner to pick up the package yet sound the alarm if a thief attempts to do so.

Ideas for sounding the alarm:

when a thief picks up package, he/she is greeted by a loud speaker sound that says "Put it down!"
when thief picks up package, he/she is greeted by recorded shotgun clicking sound

Ideas for allowing owner to pick up package:

before owner picks up package, he/she hits a button to disable the package theft detection system temporarily for 1 minute allowing a window of opportunity for picking up the package
owner picks up the package anyway. He/she already expects the theft detection response and so will not be surprised by it

In my head I imagined the end result for my prototype be something like this:

Package Position Before

Package Position After, moved upwards, theft detected!

When the green rectangle moves up for a sustained period of time, ie. 10 frames, then a package theft is detected. Here is a video example: https://youtu.be/83lW-O9whUY.

I created the above Tensorflow2 mobilenet prototype by following this video

I also created a similar Pytorch Yolo prototype albeit with package detection accuracy by following this video

To generate the prototypes, I used these datasets:

https://storage.googleapis.com/openimages/web/visualizer/index.html?set=train&type=segmentation&r=false&c=%2Fm%2F025dyy
https://public.roboflow.com/object-detection/packages-dataset/6
pictures of me holding a a brown cardboard package box at different angles and perspectives

Moving to Kria KV 260

Next I tried to load the projects to the Kria KV 260 board.

I could not load the Tensorflow mobilenet notebook because I could not download Tensorflow for ARM architecture which the Kria board is based on.

I was able to load the Pytorch yolo notebook and download the required python packages. I was not able to train the computer vision on the Kria board. Loading a pretrained yolo model seemed to work. However the performance was poor. Package detection ran at a quarter of a frame per second.

Yolo on macOS, expect the same look but much slower on Kria KV260

Vitis AI

I hoped to speed up the package detection using Xilinx's Vitis AI DPU. I opened up Kria-Pynq and launched the jupyter notebook. I explored the examples and the one that caught my attention was the dpu_resnet50 notebook with the fox.

DPU Resnet50 with the fox

The performance looked promising: 22.489 FPS. I thought if only I could make the my package detection work with DPU then that would be fast.

I cloned Vitis-AI 1.4 and visited the AI model zoo. Then I tried replaced the dpu_resnet50.xmodel with each of the xmodels in the model zoo to see which ones worked best.

Among the results that successfully detected the fox were:

inception_v1.xmodel, inception_v2.xmodel, resnet18.xmodel, resnet50.xmodel, resnet50_tf2.xmodel, resnet_v1_101_tf.xmodel, resnet_v1_152_tf.xmodel, vgg_16_tf.xmodel

I decided to go with resnet50_tf2.xmodel. My idea was that if I could build the xmodel from scratch then I could make it detect packages.

To test out building the xmodel from scratch, I download the the resnet50_tf2 GPU version of the model and I extracted the archive into a folder. I loaded in the imagenet dataset.

I thought to myself if I prove everything works with the xmodel then I will come back later and use my custom datasets to train for package detection.

I followed the README file step by step and built the xmodel. Where I deviated was the README expects Ubuntu with Nvidia Cuda GPU whereas I used macOS Docker with CPU. I had tried

An intermediate step in the xmodel build process

In the end although I was able to build an xmodel with macOS Docker, I was not able to load it into the dpu_resnet50 notebook in Kria Pynq because I kept getting a "RuntimeError: bad any_cast" error. This is effectively where my project stopped.

Future

Let us look at hypotheticals. If my xmodel had worked with DPU. My next step would have been to draw a green box around the package or to find a way to solve the package detection without doing that.

The DPU examples in Pynq seem to show that the computer vision targets the entire image and guesses what is in it. Perhaps I could modify my theft detection system to detect theft based on the order of detections.

Here is an example of a theft detection triggering sequence:

1. Detect no package

2. Detect a person and a package, aka the mailman is delivering

3. Detect a package

4. Detect a person, aka the thief

5. Detect no package, aka someone stole the package

6. Sound the alarm

Of course this sequence can be modified to exit early if it detects the owner is picking up the package in step 4. I will not go in depth for the sake of simplicity but I imagine their are strategies to differentiate the owner from the thief such as:

checking if the front door opens, ie. owner opened the door to pick up the package
checking if the car door opens, ie. owner steps out of the car to pick up the package
checking if the owner hits a button on his/her phone that sends a bluetooth signal telling the package detection system to temporarily disable itself, ie. owner is back from a run in the neighborhood and wants to disable the porch pirate detection system temporarily as not to sound the alarm

Concluding Remarks

Detecting a package is a major challenge. Typically packages come in different shapes and sizes, ranging from envelopes to cardboard boxes. This is a problem I realized while training my models. My results seems to generalize to only the image data provided. If I even slightly tilted the package held in my hand at a different angle, the model would not detect. Perhaps I just needed augmented and varied data.

Code

"""
Purpose: test which xmodels are accepted by dpu overlay
"""

xs = """vitis1.4/ENet_cityscapes_pt/ENet_cityscapes_pt.xmodel
vitis1.4/FADNet_0_pt/FADNet_0_pt.xmodel
vitis1.4/FADNet_1_pt/FADNet_1_pt.xmodel
vitis1.4/FADNet_2_pt/FADNet_2_pt.xmodel
vitis1.4/FPN-resnet18_Endov/FPN-resnet18_Endov.xmodel
vitis1.4/FPN-resnet18_covid19-seg_pt/FPN-resnet18_covid19-seg_pt.xmodel
vitis1.4/FPN_Res18_Medical_segmentation/FPN_Res18_Medical_segmentation.xmodel
vitis1.4/MLPerf_resnet50_v1.5_tf/MLPerf_resnet50_v1.5_tf.xmodel
vitis1.4/MT-resnet18_mixed_pt/MT-resnet18_mixed_pt.xmodel
vitis1.4/RefineDet-Medical_EDD_tf/RefineDet-Medical_EDD_tf.xmodel
vitis1.4/SemanticFPN_Mobilenetv2_pt/SemanticFPN_Mobilenetv2_pt.xmodel
vitis1.4/SemanticFPN_cityscapes_pt/SemanticFPN_cityscapes_pt.xmodel
vitis1.4/bcc_pt/bcc_pt.xmodel
vitis1.4/centerpoint_0_pt/centerpoint_0_pt.xmodel
vitis1.4/centerpoint_1_pt/centerpoint_1_pt.xmodel
vitis1.4/densebox_320_320/densebox_320_320.xmodel
vitis1.4/densebox_640_360/densebox_640_360.xmodel
vitis1.4/efficientNet-edgetpu-L_tf/efficientNet-edgetpu-L_tf.xmodel
vitis1.4/efficientNet-edgetpu-M_tf/efficientNet-edgetpu-M_tf.xmodel
vitis1.4/efficientNet-edgetpu-S_tf/efficientNet-edgetpu-S_tf.xmodel
vitis1.4/face-quality/face-quality.xmodel
vitis1.4/face-quality_pt/face-quality_pt.xmodel
vitis1.4/face_landmark/face_landmark.xmodel
vitis1.4/facerec-resnet20_mixed_pt/facerec-resnet20_mixed_pt.xmodel
vitis1.4/facerec_resnet20/facerec_resnet20.xmodel
vitis1.4/facerec_resnet64/facerec_resnet64.xmodel
vitis1.4/facereid-large_pt/facereid-large_pt.xmodel
vitis1.4/facereid-small_pt/facereid-small_pt.xmodel
vitis1.4/fpn/fpn.xmodel
vitis1.4/hourglass-pe_mpii/hourglass-pe_mpii.xmodel
vitis1.4/inception_resnet_v2_tf/inception_resnet_v2_tf.xmodel
vitis1.4/inception_v1/inception_v1.xmodel
vitis1.4/inception_v1_tf/inception_v1_tf.xmodel
vitis1.4/inception_v2/inception_v2.xmodel
vitis1.4/inception_v2_tf/inception_v2_tf.xmodel
vitis1.4/inception_v3/inception_v3.xmodel
vitis1.4/inception_v3_pt/inception_v3_pt.xmodel
vitis1.4/inception_v3_tf/inception_v3_tf.xmodel
vitis1.4/inception_v3_tf2/inception_v3_tf2.xmodel
vitis1.4/inception_v4/inception_v4.xmodel
vitis1.4/inception_v4_2016_09_09_tf/inception_v4_2016_09_09_tf.xmodel
vitis1.4/medical_seg_cell_tf2/medical_seg_cell_tf2.xmodel
vitis1.4/mlperf_ssd_resnet34_tf/mlperf_ssd_resnet34_tf.xmodel
vitis1.4/mobilenet_1_0_224_tf2/mobilenet_1_0_224_tf2.xmodel
vitis1.4/mobilenet_edge_0_75_tf/mobilenet_edge_0_75_tf.xmodel
vitis1.4/mobilenet_edge_1_0_tf/mobilenet_edge_1_0_tf.xmodel
vitis1.4/mobilenet_v1_0_25_128_tf/mobilenet_v1_0_25_128_tf.xmodel
vitis1.4/mobilenet_v1_0_5_160_tf/mobilenet_v1_0_5_160_tf.xmodel
vitis1.4/mobilenet_v1_1_0_224_tf/mobilenet_v1_1_0_224_tf.xmodel
vitis1.4/mobilenet_v2/mobilenet_v2.xmodel
vitis1.4/mobilenet_v2_1_0_224_tf/mobilenet_v2_1_0_224_tf.xmodel
vitis1.4/mobilenet_v2_1_4_224_tf/mobilenet_v2_1_4_224_tf.xmodel
vitis1.4/mobilenet_v2_cityscapes_tf/mobilenet_v2_cityscapes_tf.xmodel
vitis1.4/multi_task/multi_task.xmodel
vitis1.4/multi_task_v3_pt/multi_task_v3_pt.xmodel
vitis1.4/openpose_pruned_0_3/openpose_pruned_0_3.xmodel
vitis1.4/personreid-res18_pt/personreid-res18_pt.xmodel
vitis1.4/personreid-res50_pt/personreid-res50_pt.xmodel
vitis1.4/plate_detect/plate_detect.xmodel
vitis1.4/plate_num/plate_num.xmodel
vitis1.4/pmg_pt/pmg_pt.xmodel
vitis1.4/pointpainting_nuscenes_40000_64_1_pt/pointpainting_nuscenes_40000_64_1_pt.xmodel
vitis1.4/pointpillars_kitti_12000_0_pt/pointpillars_kitti_12000_0_pt.xmodel
vitis1.4/pointpillars_kitti_12000_1_pt/pointpillars_kitti_12000_1_pt.xmodel
vitis1.4/pointpillars_nuscenes_40000_64_0_pt/pointpillars_nuscenes_40000_64_0_pt.xmodel
vitis1.4/pointpillars_nuscenes_40000_64_1_pt/pointpillars_nuscenes_40000_64_1_pt.xmodel
vitis1.4/rcan_pruned_tf/rcan_pruned_tf.xmodel
vitis1.4/refinedet_VOC_tf/refinedet_VOC_tf.xmodel
vitis1.4/refinedet_baseline/refinedet_baseline.xmodel
vitis1.4/refinedet_pruned_0_8/refinedet_pruned_0_8.xmodel
vitis1.4/refinedet_pruned_0_92/refinedet_pruned_0_92.xmodel
vitis1.4/refinedet_pruned_0_96/refinedet_pruned_0_96.xmodel
vitis1.4/reid/reid.xmodel
vitis1.4/resnet18/resnet18.xmodel
vitis1.4/resnet50/resnet50.xmodel
vitis1.4/resnet50_pt/resnet50_pt.xmodel
vitis1.4/resnet50_tf2/resnet50_tf2.xmodel
vitis1.4/resnet_v1_101_tf/resnet_v1_101_tf.xmodel
vitis1.4/resnet_v1_152_tf/resnet_v1_152_tf.xmodel
vitis1.4/resnet_v1_50_tf/resnet_v1_50_tf.xmodel
vitis1.4/resnet_v2_101_tf/resnet_v2_101_tf.xmodel
vitis1.4/resnet_v2_152_tf/resnet_v2_152_tf.xmodel
vitis1.4/resnet_v2_50_tf/resnet_v2_50_tf.xmodel
vitis1.4/retinaface/retinaface.xmodel
vitis1.4/salsanext_pt/salsanext_pt.xmodel
vitis1.4/salsanext_v2_pt/salsanext_v2_pt.xmodel
vitis1.4/semantic_seg_citys_tf2/semantic_seg_citys_tf2.xmodel
vitis1.4/semanticfpn_nuimage_576_320_pt/semanticfpn_nuimage_576_320_pt.xmodel
vitis1.4/sp_net/sp_net.xmodel
vitis1.4/squeezenet/squeezenet.xmodel
vitis1.4/squeezenet_pt/squeezenet_pt.xmodel
vitis1.4/ssd_adas_pruned_0_95/ssd_adas_pruned_0_95.xmodel
vitis1.4/ssd_inception_v2_coco_tf/ssd_inception_v2_coco_tf.xmodel
vitis1.4/ssd_mobilenet_v1_coco_tf/ssd_mobilenet_v1_coco_tf.xmodel
vitis1.4/ssd_mobilenet_v2/ssd_mobilenet_v2.xmodel
vitis1.4/ssd_mobilenet_v2_coco_tf/ssd_mobilenet_v2_coco_tf.xmodel
vitis1.4/ssd_pedestrian_pruned_0_97/ssd_pedestrian_pruned_0_97.xmodel
vitis1.4/ssd_resnet_50_fpn_coco_tf/ssd_resnet_50_fpn_coco_tf.xmodel
vitis1.4/ssd_traffic_pruned_0_9/ssd_traffic_pruned_0_9.xmodel
vitis1.4/ssdlite_mobilenet_v2_coco_tf/ssdlite_mobilenet_v2_coco_tf.xmodel
vitis1.4/tiny_yolov3_vmss/tiny_yolov3_vmss.xmodel
vitis1.4/unet_chaos-CT_pt/unet_chaos-CT_pt.xmodel
vitis1.4/vgg_16_tf/vgg_16_tf.xmodel
vitis1.4/vgg_19_tf/vgg_19_tf.xmodel
vitis1.4/vpgnet_pruned_0_99/vpgnet_pruned_0_99.xmodel
vitis1.4/yolov2_voc/yolov2_voc.xmodel
vitis1.4/yolov2_voc_pruned_0_66/yolov2_voc_pruned_0_66.xmodel
vitis1.4/yolov2_voc_pruned_0_71/yolov2_voc_pruned_0_71.xmodel
vitis1.4/yolov2_voc_pruned_0_77/yolov2_voc_pruned_0_77.xmodel
vitis1.4/yolov3_adas_pruned_0_9/yolov3_adas_pruned_0_9.xmodel
vitis1.4/yolov3_bdd/yolov3_bdd.xmodel
vitis1.4/yolov3_voc/yolov3_voc.xmodel
vitis1.4/yolov3_voc_tf/yolov3_voc_tf.xmodel
vitis1.4/yolov4_leaky_spp_m/yolov4_leaky_spp_m.xmodel
vitis1.4/yolov4_leaky_spp_m_pruned_0_36/yolov4_leaky_spp_m_pruned_0_36.xmodel
vitis2.0/ENet_cityscapes_pt/ENet_cityscapes_pt.xmodel
vitis2.0/FADNet_0_pt/FADNet_0_pt.xmodel
vitis2.0/FADNet_1_pt/FADNet_1_pt.xmodel
vitis2.0/FADNet_2_pt/FADNet_2_pt.xmodel
vitis2.0/FPN-resnet18_Endov/FPN-resnet18_Endov.xmodel
vitis2.0/FPN-resnet18_covid19-seg_pt/FPN-resnet18_covid19-seg_pt.xmodel
vitis2.0/FPN_Res18_Medical_segmentation/FPN_Res18_Medical_segmentation.xmodel
vitis2.0/MLPerf_resnet50_v1.5_tf/MLPerf_resnet50_v1.5_tf.xmodel
vitis2.0/MT-resnet18_mixed_pt/MT-resnet18_mixed_pt.xmodel
vitis2.0/RefineDet-Medical_EDD_tf/RefineDet-Medical_EDD_tf.xmodel
vitis2.0/SemanticFPN_Mobilenetv2_pt/SemanticFPN_Mobilenetv2_pt.xmodel
vitis2.0/SemanticFPN_cityscapes_pt/SemanticFPN_cityscapes_pt.xmodel
vitis2.0/bcc_pt/bcc_pt.xmodel
vitis2.0/centerpoint_0_pt/centerpoint_0_pt.xmodel
vitis2.0/centerpoint_1_pt/centerpoint_1_pt.xmodel
vitis2.0/densebox_320_320/densebox_320_320.xmodel
vitis2.0/densebox_640_360/densebox_640_360.xmodel
vitis2.0/efficientNet-edgetpu-L_tf/efficientNet-edgetpu-L_tf.xmodel
vitis2.0/efficientNet-edgetpu-M_tf/efficientNet-edgetpu-M_tf.xmodel
vitis2.0/efficientNet-edgetpu-S_tf/efficientNet-edgetpu-S_tf.xmodel
vitis2.0/face-quality/face-quality.xmodel
vitis2.0/face-quality_pt/face-quality_pt.xmodel
vitis2.0/face_landmark/face_landmark.xmodel
vitis2.0/facerec-resnet20_mixed_pt/facerec-resnet20_mixed_pt.xmodel
vitis2.0/facerec_resnet20/facerec_resnet20.xmodel
vitis2.0/facerec_resnet64/facerec_resnet64.xmodel
vitis2.0/facereid-large_pt/facereid-large_pt.xmodel
vitis2.0/facereid-small_pt/facereid-small_pt.xmodel
vitis2.0/fpn/fpn.xmodel
vitis2.0/hourglass-pe_mpii/hourglass-pe_mpii.xmodel
vitis2.0/inception_resnet_v2_tf/inception_resnet_v2_tf.xmodel
vitis2.0/inception_v1/inception_v1.xmodel
vitis2.0/inception_v1_tf/inception_v1_tf.xmodel
vitis2.0/inception_v2/inception_v2.xmodel
vitis2.0/inception_v2_tf/inception_v2_tf.xmodel
vitis2.0/inception_v3/inception_v3.xmodel
vitis2.0/inception_v3_pt/inception_v3_pt.xmodel
vitis2.0/inception_v3_tf/inception_v3_tf.xmodel
vitis2.0/inception_v3_tf2/inception_v3_tf2.xmodel
vitis2.0/inception_v4/inception_v4.xmodel
vitis2.0/inception_v4_2016_09_09_tf/inception_v4_2016_09_09_tf.xmodel
vitis2.0/medical_seg_cell_tf2/medical_seg_cell_tf2.xmodel
vitis2.0/mlperf_ssd_resnet34_tf/mlperf_ssd_resnet34_tf.xmodel
vitis2.0/mobilenet_1_0_224_tf2/mobilenet_1_0_224_tf2.xmodel
vitis2.0/mobilenet_edge_0_75_tf/mobilenet_edge_0_75_tf.xmodel
vitis2.0/mobilenet_edge_1_0_tf/mobilenet_edge_1_0_tf.xmodel
vitis2.0/mobilenet_v1_0_25_128_tf/mobilenet_v1_0_25_128_tf.xmodel
vitis2.0/mobilenet_v1_0_5_160_tf/mobilenet_v1_0_5_160_tf.xmodel
vitis2.0/mobilenet_v1_1_0_224_tf/mobilenet_v1_1_0_224_tf.xmodel
vitis2.0/mobilenet_v2/mobilenet_v2.xmodel
vitis2.0/mobilenet_v2_1_0_224_tf/mobilenet_v2_1_0_224_tf.xmodel
vitis2.0/mobilenet_v2_1_4_224_tf/mobilenet_v2_1_4_224_tf.xmodel
vitis2.0/mobilenet_v2_cityscapes_tf/mobilenet_v2_cityscapes_tf.xmodel
vitis2.0/multi_task/multi_task.xmodel
vitis2.0/multi_task_v3_pt/multi_task_v3_pt.xmodel
vitis2.0/openpose_pruned_0_3/openpose_pruned_0_3.xmodel
vitis2.0/personreid-res18_pt/personreid-res18_pt.xmodel
vitis2.0/personreid-res50_pt/personreid-res50_pt.xmodel
vitis2.0/plate_detect/plate_detect.xmodel
vitis2.0/plate_num/plate_num.xmodel
vitis2.0/pmg_pt/pmg_pt.xmodel
vitis2.0/pointpainting_nuscenes_40000_64_1_pt/pointpainting_nuscenes_40000_64_1_pt.xmodel
vitis2.0/pointpillars_kitti_12000_0_pt/pointpillars_kitti_12000_0_pt.xmodel
vitis2.0/pointpillars_kitti_12000_1_pt/pointpillars_kitti_12000_1_pt.xmodel
vitis2.0/pointpillars_nuscenes_40000_64_0_pt/pointpillars_nuscenes_40000_64_0_pt.xmodel
vitis2.0/pointpillars_nuscenes_40000_64_1_pt/pointpillars_nuscenes_40000_64_1_pt.xmodel
vitis2.0/rcan_pruned_tf/rcan_pruned_tf.xmodel
vitis2.0/refinedet_VOC_tf/refinedet_VOC_tf.xmodel
vitis2.0/refinedet_baseline/refinedet_baseline.xmodel
vitis2.0/refinedet_pruned_0_8/refinedet_pruned_0_8.xmodel
vitis2.0/refinedet_pruned_0_92/refinedet_pruned_0_92.xmodel
vitis2.0/refinedet_pruned_0_96/refinedet_pruned_0_96.xmodel
vitis2.0/reid/reid.xmodel
vitis2.0/resnet18/resnet18.xmodel
vitis2.0/resnet50/resnet50.xmodel
vitis2.0/resnet50_pt/resnet50_pt.xmodel
vitis2.0/resnet50_tf2/resnet50_tf2.xmodel
vitis2.0/resnet_v1_101_tf/resnet_v1_101_tf.xmodel
vitis2.0/resnet_v1_152_tf/resnet_v1_152_tf.xmodel
vitis2.0/resnet_v1_50_tf/resnet_v1_50_tf.xmodel
vitis2.0/resnet_v2_101_tf/resnet_v2_101_tf.xmodel
vitis2.0/resnet_v2_152_tf/resnet_v2_152_tf.xmodel
vitis2.0/resnet_v2_50_tf/resnet_v2_50_tf.xmodel
vitis2.0/retinaface/retinaface.xmodel
vitis2.0/salsanext_pt/salsanext_pt.xmodel
vitis2.0/salsanext_v2_pt/salsanext_v2_pt.xmodel
vitis2.0/semantic_seg_citys_tf2/semantic_seg_citys_tf2.xmodel
vitis2.0/semanticfpn_nuimage_576_320_pt/semanticfpn_nuimage_576_320_pt.xmodel
vitis2.0/sp_net/sp_net.xmodel
vitis2.0/squeezenet/squeezenet.xmodel
vitis2.0/squeezenet_pt/squeezenet_pt.xmodel
vitis2.0/ssd_adas_pruned_0_95/ssd_adas_pruned_0_95.xmodel
vitis2.0/ssd_inception_v2_coco_tf/ssd_inception_v2_coco_tf.xmodel
vitis2.0/ssd_mobilenet_v1_coco_tf/ssd_mobilenet_v1_coco_tf.xmodel
vitis2.0/ssd_mobilenet_v2/ssd_mobilenet_v2.xmodel
vitis2.0/ssd_mobilenet_v2_coco_tf/ssd_mobilenet_v2_coco_tf.xmodel
vitis2.0/ssd_pedestrian_pruned_0_97/ssd_pedestrian_pruned_0_97.xmodel
vitis2.0/ssd_resnet_50_fpn_coco_tf/ssd_resnet_50_fpn_coco_tf.xmodel
vitis2.0/ssd_traffic_pruned_0_9/ssd_traffic_pruned_0_9.xmodel
vitis2.0/ssdlite_mobilenet_v2_coco_tf/ssdlite_mobilenet_v2_coco_tf.xmodel
vitis2.0/tiny_yolov3_vmss/tiny_yolov3_vmss.xmodel
vitis2.0/unet_chaos-CT_pt/unet_chaos-CT_pt.xmodel
vitis2.0/vgg_16_tf/vgg_16_tf.xmodel
vitis2.0/vgg_19_tf/vgg_19_tf.xmodel
vitis2.0/vpgnet_pruned_0_99/vpgnet_pruned_0_99.xmodel
vitis2.0/yolov2_voc/yolov2_voc.xmodel
vitis2.0/yolov2_voc_pruned_0_66/yolov2_voc_pruned_0_66.xmodel
vitis2.0/yolov2_voc_pruned_0_71/yolov2_voc_pruned_0_71.xmodel
vitis2.0/yolov2_voc_pruned_0_77/yolov2_voc_pruned_0_77.xmodel
vitis2.0/yolov3_adas_pruned_0_9/yolov3_adas_pruned_0_9.xmodel
vitis2.0/yolov3_bdd/yolov3_bdd.xmodel
vitis2.0/yolov3_voc/yolov3_voc.xmodel
vitis2.0/yolov3_voc_tf/yolov3_voc_tf.xmodel
vitis2.0/yolov4_leaky_spp_m/yolov4_leaky_spp_m.xmodel
vitis2.0/yolov4_leaky_spp_m_pruned_0_36/yolov4_leaky_spp_m_pruned_0_36.xmodel""".split('\n')

for x in xs:
    try:
        overlay.load_model(x)
        print('pass', x)
    except:
        print('fail', x)

"""
Purpose: test which xmodels work with same dpu inference code as resnet notebook
"""

xs = """vitis1.4/ENet_cityscapes_pt/ENet_cityscapes_pt.xmodel
vitis1.4/FADNet_0_pt/FADNet_0_pt.xmodel
vitis1.4/FADNet_1_pt/FADNet_1_pt.xmodel
vitis1.4/FADNet_2_pt/FADNet_2_pt.xmodel
vitis1.4/FPN-resnet18_Endov/FPN-resnet18_Endov.xmodel
vitis1.4/FPN-resnet18_covid19-seg_pt/FPN-resnet18_covid19-seg_pt.xmodel
vitis1.4/FPN_Res18_Medical_segmentation/FPN_Res18_Medical_segmentation.xmodel
vitis1.4/MLPerf_resnet50_v1.5_tf/MLPerf_resnet50_v1.5_tf.xmodel
vitis1.4/MT-resnet18_mixed_pt/MT-resnet18_mixed_pt.xmodel
vitis1.4/RefineDet-Medical_EDD_tf/RefineDet-Medical_EDD_tf.xmodel
vitis1.4/SemanticFPN_Mobilenetv2_pt/SemanticFPN_Mobilenetv2_pt.xmodel
vitis1.4/SemanticFPN_cityscapes_pt/SemanticFPN_cityscapes_pt.xmodel
vitis1.4/bcc_pt/bcc_pt.xmodel
vitis1.4/centerpoint_0_pt/centerpoint_0_pt.xmodel
vitis1.4/centerpoint_1_pt/centerpoint_1_pt.xmodel
vitis1.4/densebox_320_320/densebox_320_320.xmodel
vitis1.4/densebox_640_360/densebox_640_360.xmodel
vitis1.4/efficientNet-edgetpu-M_tf/efficientNet-edgetpu-M_tf.xmodel
vitis1.4/efficientNet-edgetpu-S_tf/efficientNet-edgetpu-S_tf.xmodel
vitis1.4/face-quality/face-quality.xmodel
vitis1.4/face-quality_pt/face-quality_pt.xmodel
vitis1.4/face_landmark/face_landmark.xmodel
vitis1.4/facerec-resnet20_mixed_pt/facerec-resnet20_mixed_pt.xmodel
vitis1.4/facerec_resnet20/facerec_resnet20.xmodel
vitis1.4/facerec_resnet64/facerec_resnet64.xmodel
vitis1.4/facereid-large_pt/facereid-large_pt.xmodel
vitis1.4/facereid-small_pt/facereid-small_pt.xmodel
vitis1.4/fpn/fpn.xmodel
vitis1.4/hourglass-pe_mpii/hourglass-pe_mpii.xmodel
vitis1.4/inception_resnet_v2_tf/inception_resnet_v2_tf.xmodel
vitis1.4/inception_v1/inception_v1.xmodel
vitis1.4/inception_v1_tf/inception_v1_tf.xmodel
vitis1.4/inception_v2/inception_v2.xmodel
vitis1.4/inception_v2_tf/inception_v2_tf.xmodel
vitis1.4/inception_v3/inception_v3.xmodel
vitis1.4/inception_v3_pt/inception_v3_pt.xmodel
vitis1.4/inception_v3_tf/inception_v3_tf.xmodel
vitis1.4/inception_v3_tf2/inception_v3_tf2.xmodel
vitis1.4/inception_v4/inception_v4.xmodel
vitis1.4/inception_v4_2016_09_09_tf/inception_v4_2016_09_09_tf.xmodel
vitis1.4/medical_seg_cell_tf2/medical_seg_cell_tf2.xmodel
vitis1.4/mlperf_ssd_resnet34_tf/mlperf_ssd_resnet34_tf.xmodel
vitis1.4/mobilenet_1_0_224_tf2/mobilenet_1_0_224_tf2.xmodel
vitis1.4/mobilenet_edge_0_75_tf/mobilenet_edge_0_75_tf.xmodel
vitis1.4/mobilenet_edge_1_0_tf/mobilenet_edge_1_0_tf.xmodel
vitis1.4/mobilenet_v1_0_25_128_tf/mobilenet_v1_0_25_128_tf.xmodel
vitis1.4/mobilenet_v1_0_5_160_tf/mobilenet_v1_0_5_160_tf.xmodel
vitis1.4/mobilenet_v1_1_0_224_tf/mobilenet_v1_1_0_224_tf.xmodel
vitis1.4/mobilenet_v2/mobilenet_v2.xmodel
vitis1.4/mobilenet_v2_1_0_224_tf/mobilenet_v2_1_0_224_tf.xmodel
vitis1.4/mobilenet_v2_1_4_224_tf/mobilenet_v2_1_4_224_tf.xmodel
vitis1.4/mobilenet_v2_cityscapes_tf/mobilenet_v2_cityscapes_tf.xmodel
vitis1.4/multi_task/multi_task.xmodel
vitis1.4/multi_task_v3_pt/multi_task_v3_pt.xmodel
vitis1.4/openpose_pruned_0_3/openpose_pruned_0_3.xmodel
vitis1.4/personreid-res18_pt/personreid-res18_pt.xmodel
vitis1.4/personreid-res50_pt/personreid-res50_pt.xmodel
vitis1.4/plate_detect/plate_detect.xmodel
vitis1.4/pmg_pt/pmg_pt.xmodel
vitis1.4/pointpainting_nuscenes_40000_64_1_pt/pointpainting_nuscenes_40000_64_1_pt.xmodel
vitis1.4/pointpillars_kitti_12000_0_pt/pointpillars_kitti_12000_0_pt.xmodel
vitis1.4/pointpillars_kitti_12000_1_pt/pointpillars_kitti_12000_1_pt.xmodel
vitis1.4/pointpillars_nuscenes_40000_64_0_pt/pointpillars_nuscenes_40000_64_0_pt.xmodel
vitis1.4/pointpillars_nuscenes_40000_64_1_pt/pointpillars_nuscenes_40000_64_1_pt.xmodel
vitis1.4/rcan_pruned_tf/rcan_pruned_tf.xmodel
vitis1.4/refinedet_VOC_tf/refinedet_VOC_tf.xmodel
vitis1.4/refinedet_baseline/refinedet_baseline.xmodel
vitis1.4/refinedet_pruned_0_8/refinedet_pruned_0_8.xmodel
vitis1.4/refinedet_pruned_0_92/refinedet_pruned_0_92.xmodel
vitis1.4/refinedet_pruned_0_96/refinedet_pruned_0_96.xmodel
vitis1.4/reid/reid.xmodel
vitis1.4/resnet18/resnet18.xmodel
vitis1.4/resnet50/resnet50.xmodel
vitis1.4/resnet50_pt/resnet50_pt.xmodel
vitis1.4/resnet50_tf2/resnet50_tf2.xmodel
vitis1.4/resnet_v1_101_tf/resnet_v1_101_tf.xmodel
vitis1.4/resnet_v1_152_tf/resnet_v1_152_tf.xmodel
vitis1.4/resnet_v1_50_tf/resnet_v1_50_tf.xmodel
vitis1.4/retinaface/retinaface.xmodel
vitis1.4/salsanext_pt/salsanext_pt.xmodel
vitis1.4/salsanext_v2_pt/salsanext_v2_pt.xmodel
vitis1.4/semantic_seg_citys_tf2/semantic_seg_citys_tf2.xmodel
vitis1.4/semanticfpn_nuimage_576_320_pt/semanticfpn_nuimage_576_320_pt.xmodel
vitis1.4/squeezenet/squeezenet.xmodel
vitis1.4/squeezenet_pt/squeezenet_pt.xmodel
vitis1.4/ssd_adas_pruned_0_95/ssd_adas_pruned_0_95.xmodel
vitis1.4/ssd_inception_v2_coco_tf/ssd_inception_v2_coco_tf.xmodel
vitis1.4/ssd_mobilenet_v1_coco_tf/ssd_mobilenet_v1_coco_tf.xmodel
vitis1.4/ssd_mobilenet_v2/ssd_mobilenet_v2.xmodel
vitis1.4/ssd_mobilenet_v2_coco_tf/ssd_mobilenet_v2_coco_tf.xmodel
vitis1.4/ssd_pedestrian_pruned_0_97/ssd_pedestrian_pruned_0_97.xmodel
vitis1.4/ssd_resnet_50_fpn_coco_tf/ssd_resnet_50_fpn_coco_tf.xmodel
vitis1.4/ssd_traffic_pruned_0_9/ssd_traffic_pruned_0_9.xmodel
vitis1.4/ssdlite_mobilenet_v2_coco_tf/ssdlite_mobilenet_v2_coco_tf.xmodel
vitis1.4/tiny_yolov3_vmss/tiny_yolov3_vmss.xmodel
vitis1.4/unet_chaos-CT_pt/unet_chaos-CT_pt.xmodel
vitis1.4/vgg_16_tf/vgg_16_tf.xmodel
vitis1.4/vgg_19_tf/vgg_19_tf.xmodel
vitis1.4/vpgnet_pruned_0_99/vpgnet_pruned_0_99.xmodel
vitis1.4/yolov2_voc/yolov2_voc.xmodel
vitis1.4/yolov2_voc_pruned_0_66/yolov2_voc_pruned_0_66.xmodel
vitis1.4/yolov2_voc_pruned_0_71/yolov2_voc_pruned_0_71.xmodel
vitis1.4/yolov2_voc_pruned_0_77/yolov2_voc_pruned_0_77.xmodel
vitis1.4/yolov3_adas_pruned_0_9/yolov3_adas_pruned_0_9.xmodel
vitis1.4/yolov3_bdd/yolov3_bdd.xmodel
vitis1.4/yolov3_voc/yolov3_voc.xmodel
vitis1.4/yolov3_voc_tf/yolov3_voc_tf.xmodel
vitis1.4/yolov4_leaky_spp_m/yolov4_leaky_spp_m.xmodel
vitis1.4/yolov4_leaky_spp_m_pruned_0_36/yolov4_leaky_spp_m_pruned_0_36.xmodel
vitis2.0/RefineDet-Medical_EDD_tf/RefineDet-Medical_EDD_tf.xmodel
vitis2.0/SemanticFPN_Mobilenetv2_pt/SemanticFPN_Mobilenetv2_pt.xmodel
vitis2.0/centerpoint_0_pt/centerpoint_0_pt.xmodel
vitis2.0/centerpoint_1_pt/centerpoint_1_pt.xmodel
vitis2.0/densebox_320_320/densebox_320_320.xmodel
vitis2.0/densebox_640_360/densebox_640_360.xmodel
vitis2.0/efficientNet-edgetpu-M_tf/efficientNet-edgetpu-M_tf.xmodel
vitis2.0/efficientNet-edgetpu-S_tf/efficientNet-edgetpu-S_tf.xmodel
vitis2.0/face-quality/face-quality.xmodel
vitis2.0/face-quality_pt/face-quality_pt.xmodel
vitis2.0/face_landmark/face_landmark.xmodel
vitis2.0/facerec-resnet20_mixed_pt/facerec-resnet20_mixed_pt.xmodel
vitis2.0/facerec_resnet20/facerec_resnet20.xmodel
vitis2.0/facerec_resnet64/facerec_resnet64.xmodel
vitis2.0/hourglass-pe_mpii/hourglass-pe_mpii.xmodel
vitis2.0/inception_resnet_v2_tf/inception_resnet_v2_tf.xmodel
vitis2.0/inception_v1/inception_v1.xmodel
vitis2.0/inception_v1_tf/inception_v1_tf.xmodel
vitis2.0/inception_v2/inception_v2.xmodel
vitis2.0/inception_v2_tf/inception_v2_tf.xmodel
vitis2.0/inception_v3/inception_v3.xmodel
vitis2.0/inception_v3_pt/inception_v3_pt.xmodel
vitis2.0/inception_v3_tf/inception_v3_tf.xmodel
vitis2.0/inception_v3_tf2/inception_v3_tf2.xmodel
vitis2.0/inception_v4/inception_v4.xmodel
vitis2.0/inception_v4_2016_09_09_tf/inception_v4_2016_09_09_tf.xmodel
vitis2.0/medical_seg_cell_tf2/medical_seg_cell_tf2.xmodel
vitis2.0/mobilenet_1_0_224_tf2/mobilenet_1_0_224_tf2.xmodel
vitis2.0/mobilenet_edge_0_75_tf/mobilenet_edge_0_75_tf.xmodel
vitis2.0/mobilenet_edge_1_0_tf/mobilenet_edge_1_0_tf.xmodel
vitis2.0/mobilenet_v1_0_25_128_tf/mobilenet_v1_0_25_128_tf.xmodel
vitis2.0/mobilenet_v1_0_5_160_tf/mobilenet_v1_0_5_160_tf.xmodel
vitis2.0/mobilenet_v1_1_0_224_tf/mobilenet_v1_1_0_224_tf.xmodel
vitis2.0/mobilenet_v2/mobilenet_v2.xmodel
vitis2.0/mobilenet_v2_1_0_224_tf/mobilenet_v2_1_0_224_tf.xmodel
vitis2.0/mobilenet_v2_1_4_224_tf/mobilenet_v2_1_4_224_tf.xmodel
vitis2.0/mobilenet_v2_cityscapes_tf/mobilenet_v2_cityscapes_tf.xmodel
vitis2.0/openpose_pruned_0_3/openpose_pruned_0_3.xmodel
vitis2.0/plate_detect/plate_detect.xmodel
vitis2.0/pointpainting_nuscenes_40000_64_1_pt/pointpainting_nuscenes_40000_64_1_pt.xmodel
vitis2.0/pointpillars_kitti_12000_0_pt/pointpillars_kitti_12000_0_pt.xmodel
vitis2.0/pointpillars_kitti_12000_1_pt/pointpillars_kitti_12000_1_pt.xmodel
vitis2.0/pointpillars_nuscenes_40000_64_0_pt/pointpillars_nuscenes_40000_64_0_pt.xmodel
vitis2.0/pointpillars_nuscenes_40000_64_1_pt/pointpillars_nuscenes_40000_64_1_pt.xmodel
vitis2.0/rcan_pruned_tf/rcan_pruned_tf.xmodel
vitis2.0/refinedet_VOC_tf/refinedet_VOC_tf.xmodel
vitis2.0/refinedet_baseline/refinedet_baseline.xmodel
vitis2.0/refinedet_pruned_0_8/refinedet_pruned_0_8.xmodel
vitis2.0/refinedet_pruned_0_92/refinedet_pruned_0_92.xmodel
vitis2.0/refinedet_pruned_0_96/refinedet_pruned_0_96.xmodel
vitis2.0/salsanext_pt/salsanext_pt.xmodel
vitis2.0/salsanext_v2_pt/salsanext_v2_pt.xmodel
vitis2.0/semantic_seg_citys_tf2/semantic_seg_citys_tf2.xmodel
vitis2.0/squeezenet/squeezenet.xmodel
vitis2.0/squeezenet_pt/squeezenet_pt.xmodel
vitis2.0/ssd_adas_pruned_0_95/ssd_adas_pruned_0_95.xmodel
vitis2.0/ssd_inception_v2_coco_tf/ssd_inception_v2_coco_tf.xmodel
vitis2.0/ssd_mobilenet_v1_coco_tf/ssd_mobilenet_v1_coco_tf.xmodel
vitis2.0/ssd_mobilenet_v2/ssd_mobilenet_v2.xmodel
vitis2.0/ssd_mobilenet_v2_coco_tf/ssd_mobilenet_v2_coco_tf.xmodel
vitis2.0/ssd_pedestrian_pruned_0_97/ssd_pedestrian_pruned_0_97.xmodel
vitis2.0/ssd_traffic_pruned_0_9/ssd_traffic_pruned_0_9.xmodel
vitis2.0/ssdlite_mobilenet_v2_coco_tf/ssdlite_mobilenet_v2_coco_tf.xmodel
vitis2.0/unet_chaos-CT_pt/unet_chaos-CT_pt.xmodel
vitis2.0/vgg_16_tf/vgg_16_tf.xmodel
vitis2.0/vgg_19_tf/vgg_19_tf.xmodel
vitis2.0/vpgnet_pruned_0_99/vpgnet_pruned_0_99.xmodel
vitis2.0/yolov2_voc/yolov2_voc.xmodel
vitis2.0/yolov2_voc_pruned_0_66/yolov2_voc_pruned_0_66.xmodel
vitis2.0/yolov2_voc_pruned_0_71/yolov2_voc_pruned_0_71.xmodel
vitis2.0/yolov2_voc_pruned_0_77/yolov2_voc_pruned_0_77.xmodel""".split("\n")

for x in ["dpu_resnet50.xmodel"] + xs:
    try:
        # x = "dpu_resnet50.xmodel"
        overlay.load_model(x)
        # ------------------------------------
        dpu = overlay.runner

        inputTensors = dpu.get_input_tensors()
        outputTensors = dpu.get_output_tensors()

        shapeIn = tuple(inputTensors[0].dims)
        shapeOut = tuple(outputTensors[0].dims)
        outputSize = int(outputTensors[0].get_data_size() / shapeIn[0])

        softmax = np.empty(outputSize)
        # ------------------------------------
        output_data = [np.empty(shapeOut, dtype=np.float32, order="C")]
        input_data = [np.empty(shapeIn, dtype=np.float32, order="C")]
        image = input_data[0]
        # ------------------------------------
        def run(image_index, display=False):
            preprocessed = preprocess_fn(cv2.imread(
                os.path.join(image_folder, original_images[image_index])))
            image[0,...] = preprocessed.reshape(shapeIn[1:])
            job_id = dpu.execute_async(input_data, output_data)
            dpu.wait(job_id)
            temp = [j.reshape(1, outputSize) for j in output_data]
            softmax = calculate_softmax(temp[0][0])
            if display:
                display_image = cv2.imread(os.path.join(
                    image_folder, original_images[image_index]))
                _, ax = plt.subplots(1)
                _ = ax.imshow(cv2.cvtColor(display_image, cv2.COLOR_BGR2RGB))
        #         print("Classification: {}".format(predict_label(softmax)))
            return predict_label(softmax).strip()
        # ------------------------------------
        run1 = run(1, display=False)
        run2 = run(2, display=False)
        run3 = run(3, display=False)
        print(x, [run1, run2, run3])
    except:
        pass
#         print(x, 'fail')

Credits

Jonathan Li

3 projects • 1 follower

Contact

Thanks to Nicholas Renotte.

Comments

Please log in or sign up to comment.

Porch Pirate Theft Detection

Things used in this project

Hardware components

Software apps and online services

Story

Problem

Solution

Detection

Moving to Kria KV 260

Vitis AI

Future

Concluding Remarks

Schematics

Connections Schematic

Code

test_overlay_xmodel.py

test_dpu_xmodel.py

Package Detection with Tensorflow

Package Detection with Yolo

Credits

Jonathan Li

Comments

Embed the widget on your own site

Porch Pirate Theft Detection

Porch Pirate Theft Detection

Things used in this project

Hardware components

Software apps and online services

Story

Problem

Solution

Detection

Moving to Kria KV 260

Vitis AI

Future

Concluding Remarks

Schematics

Connections Schematic

Code

test_overlay_xmodel.py

test_dpu_xmodel.py

Package Detection with Tensorflow

Package Detection with Yolo

Credits

Jonathan Li

Comments

Related channels and tags